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数据分析方法五种 


本书由五种讨论数据分析方法的小册子组成，分别是 <分析复杂调査数据>、 
《缺失数 据》、 《社会网络分 析》、 《因子 分析： 统计方法与应用 问理》 以及《基于 


行动者的模 型》。 本书主要介绍社会学研究方法 之一， 即数据分析方法。该书涵盖 
的是社会科学中技术性非常强的 内容， 前四种小册子从基于设计的分析入手，介绍 
了分析 复杂调 査数据的传统方法， 阐 述了如何处理社会科学研究中的缺失数据，同 
时对 w 学科的社会网络分析法进行了说明，并详细介绍了因子分析法。 最后 ，从基 
于横型的角度.以举例的形式详细解释了基于行动者的棋型的基本原理，讨论了相 
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本书由五种讨论数据分析方法的小册子组成々别是《分析复杂调査数 据》、 
《缺失数据》 、《社会网络分析》、《因子分析:统计方法与应用问题》以及《基于行动者 
的模 型》。 本书的主要内容如书名所示，是介绍社会学研究分析方法之一^数 
据分析方法 4 《分 析复杂调査数据》为研究者在抽样设计和调査数据分析的联合 
方面提供了最新的情况,使研究者能深入了解方差估计的策略及抽样权重后复杂 
截面调査数据的初级和多变量分析等主要问題，使假设与研究相适应，从而完成 
更有效的统计推断。《缺失数据》给出了处理缺失数据问题的新策略，在缺失数据 
的条件下回顾最大似然估计，解释了插补法的 EM 算法和多重插补方法，并讨论了 
不可忽略的缺失数据。 《社会 网触析附对这种跨学科的数据分析的研究方法， 
阐述了社会网络分析的一些基本概念和数据收集问題，并介绍了网络分析方法和 
模型，讨论了社会网络分析的三个主要的潜在假设,反映了社会网络分析的最新 
进展。《因子分析:统计方法与应用问题>用明确的数据分析例子，详细地介绍了因 
子分析的不同方法，以及它们各自在何种情况下最实用，同时深人地讨论了验证 
性和探索性因子分析的差别，使读者能够对因子分析建立起系统性的知识。《基 
于行动者的模型》以举例的形式详细解释了基于行动者模型的基本原理，并讨论 
了基于行动者模型的应用软件，清晰明确，填补了该领域的空白。 

数据分析方法虽然涵盖的是社会科学中技术性非常强的内容，但本书行文 
避免了复杂的数学公式推导。作者用具体的例子，结合语言和图形，帮助研究 
者理解相关分析方法的基本概念和棋型。相信本书的出版能够推动国内社会 
科学定量研究的进一步发展 • 




往事如烟，光阴如梭，转眼间，出国已然十年有余。1996.年赴美留学，最初 
选择的主攻方向是比较历史社会学，研究的兴趣是中国的制度变迁问题。以我 
以前在国内所受的学术训练，基本是看不上定量研究的。一方面，我们傾向于 
研究大问題，不喜欢纠缠于细枝末节 • 国内一位老师的话给我的印象很深 ♦大 
致是说:如果你看到一堵墙就要倒了，还用樽着纠缠于那堵墙的倾斜角度究竞 
是几度吗？所以，很多研究都是大而化之，只要说得通即可 * 另一方面，国内 
(十年前)的统计教学,总的来说与社会研究中的实际问题是相脱节的。结果 
是，很多原先对定量研究感兴趣的学生在学完统计之后，依旧无从下手,逐斯失 
去了对定量研究的兴趣。 

我所就读的美国加州大学洛杉肌分校社会学系，在定量研究方面有着系统 
的博士训练课程。不论究兴趣是定量还是定性的，所有的研究生第一年的头 
两个学期必须修两门中^统计课，最后一个学期的系列课程则是简单介绍线性 
回归以外的其他统计方法，是选修课。希望进一步学习定量研究方法的可以在 
第二年修读另外一个三学期的系列课程，其中头两门课叫“调査数据分析”，第 
三门叫“研究设计' 除此以外，还有如“定类数据分析”、“人口学方法与技术' 
“事件史分析”、“多层线性模型”等专门课程供学生 选修。 该学校的统计系、心 
理系、教育系、经济系也有一批蜚声国际的学者，提供不同的、更加专业化的课 
程供学生选修。2001年完成博士学业之后，我又受安德鲁 • 梅隆基金会资助， 
在世界定量社会科学研究的重镇密歎根大学从事两年的博士后研究，其间旁听 
龄教授为博士生賊的统计课程，并参与该校社会鹏院 (Institute for Social 





2003 年，我赴港工作，在香港科技大学社会科学部，教授研究生的两门核心 
定量方法课程。香港科技大学社会科学部自创建以来，非常重视社会科学研究 
方法论的训练。我开设的笫一门课“社会科学里的统计学” (Statistics for Social 
Science) 为所有研究型顼士生和博士生的必修课，而第二门课“社会科学中的定 
量分析”为博士生的必修课(亊实上，大部分硕士生在修完第一门课后都会继续 
选修第二门课)。我在讲授这两门课的时候，根据社会科学研究生的数理基础 
比较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的例子，结合语言和 
图形，帮助学生理解统计的基本概念和模型。课程的重点放在如何应用定量分 
析模型研究社会实际问翅上，即社会研究者主要为定量统计方法的“消费者”而 
非“生 产者' 作为“消费者”，学完这些课程后，我们一方面能够读懂、欣赏和评 
价别人在同行评议的刊物上发表的定置研究的文章>另一方面，也能在自己的 
研究中运用这些成熟的方法论技术。 

上述两门课的内容，尽管在线性回归棋型的内容上有少量重复，但各有侧 
重。“社会科学里的统计学” (Statistics for Social Science) 从介绍最基本的社会 
研究方法论和统计学原理开始，到多元线性回归模型结朿，内容涵盖了描述 
性统计的基本方法、统计推论的原理、假设检验、列联表分析、方差和协方差 
分析、简单线性回归模型、多元线性回归模型，以及线性回归模型的假设和模 
型诊断。“社会科学中的定量分析”则介绍在经典线性回归模型的假设不成 
立的情况下的一些模型和方法，将重点放在因变量为定类数据的分析模型 
上，包括两分类的 logistic 回归模型、多分类 logistic 回归模型、定序 logistic 回 
归棋型、条件 logistic 回归棋型、多维列联表的对数线性和对数乘积棋型、有关 
删节数据的模型、纵贯数据的分析模型，包括迫踪研究和事件史的分析方法。 



讲稿结集出版，并帮助我将原来的英文课程讲稿译成了中文。但是，由于种种 
原因，这两本书拖了四年多还没有完成。世界著名的出版社 SAGE 的“定量社 
会科学研究”丛书闻名遐途，每本书都写得通俗易慊。中山大学马骏教授向格 
致出版社何元龙社长推荐了这套书，当格致出版社向我捱出从这套丛书中精选 
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一批翻译，以飨中文读者时，我非常支持这个想法,因为这从某种程度上弥补了 
我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的亊。不但要有对中英文两种语言的精准把握能 
力，还要有对实质内容有较深的理解能力，而这套丛书涵盖的又恰恰是社会科 


学中技术性非常强的内容，只有语言能力是远远不能胜任的 * 在短短的一年时 
间里，我们组织了来自中国内地及港台地区的二十几位研究生参与了这项工 
程，他们目前大部分是香港科技大学的硕士和博士研究生，受过严格的社会科 


们是 S 

香港科技大学社会科学部博士研究生蒋勘、李骏、盛智明、叶华、张卓妮、 

郑冰岛，硕士研究生贺光烨、李兰、林毓玲、肖东亮、辛济云、於嘉、余珊珊，应 

用社会经济研究中心研究员李俊秀;香港大学教育学院博士研究生洪岩璧； 
北京大学社会学系博士研究生李丁、赵亮员I中国人民大学人口学系讲师巫 
锡炜；中国台湾“中央”研究院社会学所助理研究员林宗弘;南京师范大学心 

理学系副教授陈陈 > 美国北卡罗来纳大学教堂山分校社会学系博士候选人姜 

念涛;美国加州大学洛杉矶分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单的介绍。尽管每本 

书因本身内容和译者的行文风格有所差异，校对也未免挂一漏万，术语的标 

准译法方面还有很大的改进空间，伹所有的参与者都做了最大的努力，在繁 

忙的学习和研究之余，在不到一年的时间内，完成了三十五本书、超过百万宇 
的黼译任务。李骏、叶华、张卓妮、贺光烨、宋曦、於裹、郑冰岛和林宗弘除了 
承担自己的翻译任务之外，还在初稿校对方面付出了大量的劳动9香港科技 
大学霍英东南沙研究院的工作人员曾东林，协助我通读了全稿，在此我也致 
以诚挚的谢意。有些作者,如香港科技大学黄善国教授、美国约翰 * 霍普金 
斯大学郝令昕教授，也参与了审校工作。 

由于所选每本书都有一篇序言，对相关方法的背录和应用作了很好的介 
绍，我们均予以保留，内容在此不再 赘述。 为了方便起见，我们将内容相似的书 
目集册出版，每册三至五本不等，共八册，它们分别是:《线性回归分析基 确》、 
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他们董点关注了基于设计的方法，这种方法直接在分析中涉及抽样设计(虽然他们也讨 
论了基于模型的视角，该视角在某些分析中能 ir 充基于设计的法），他们还以流行的软 
件为例_释了这种方法的使用。调査分析的学生将会在他们以样本为基础作出统计推 
断的努力中发现本书的巨大益处。 -• 

一廖福挺 (TimFutingbao) 



调査分析似乎通常是在所有的样本观察值都以同等的概率被独立选中的 
方式操作实行的。如果在数据收集中使用的是简单随机抽样 (SRS) ，这种分析 
就是对的，伹实际上样本选择比 SRS 复杂得多。某些样本观察值可能比其他观 
察值以更高的概率被选中，之所以被包括在样本中，是因为他们属于某个特定 
组别的成员（比如家庭)，而不是被独立选取的。我们可以在调査数据的分析中 
简单地忽略这些与 SRS 相悖的亊实吗？使用调査数据分析统计书中的标准技 
术是否合适？或者是否有特别的方法和计算机程序可用于更合适的复杂调査 
数据的分析？这些间题将在随后的章节中进行论述。 

今天典型的社会调査反映了统计理论和关于社会现象的知识两者间的结 
合，过去70年间从许多不同的调査中获得的经验塑造了它的 发展。 社会调査的 
进行是为了满足用以讨论社会、政治和公共卫生议题的倌息需要。为了满足这 
种信息欝要，在政府内部和外部都设立了调査机构。但是，在早期提供这些需 
要的信息的尝试中，调査小组们最关心的是实地调査中的操作问题，如抽样框 
的建立，员工培训/监督，以及成本的降低等，理论上的抽样议通获得的只是次 
级重视 (Stephan， 1948)。随着这些实际问题得到解决，现代抽样实践方法的发 
展远远超越了 SRS。 复杂抽样设计己经走在了前面，随之而来的是一系列分析 
问题。 

因为早期调査通常需要的只是描述性统计，所以很少有人对分析问埋感兴 
趣。 更近一些时期，社会和政策科学家对分析研究的需要巳经增加，那些并不 
参与数据收集过程的研究人员，正利用可用的社会调査数据对各种不同的现实 
议埋进行 分析。 这个传统上被称为二手资料分析 （Kendall & Lazarsfeld, 




1950) 。 研究者通常并没有对复杂抽样设计的发展给予应有的关注，并假设这 
些设计对将要使用的分析程序没有什么彩响。 

二手资料分析中统计技术使用的增加以及近年来对数线性模型、 logistic 回 
归和其他多变量技术的使用 (Aldrich & Nelson, 1984; Goodman, 19725 Swaf¬ 
ford, 1980)， 并没有把设计和分析更紧密地结合起来。这些技术断定数据收集 
使用的是简单有放回随机抽样 (SRSWRM 旦这个假设在应用了观测单位的分 
层和整群方法以及不等概率选择法的社会调査中几乎无法得到 满足。 因此，利 
用 SRSWR 假设的社会调査分析可能导致有偏差和误导性的结果。比如， 
Kieoolt 和 N a tha n (1985) 在他们关于二手资料分析的书中承认了这个问题，但 
是他们几乎没有就如何把抽样权重和其他设计特征礅人分析之中提供什么建 
议。最近一篇关于公共健康和流行病学的文献研究表明:对基于设计的调査分 
析方法的使用正在逐渐增加，但依然处于较低水平 (Levy & Stolte， 2000)。 

任何对抽样进行了限制且那些限制超越了 SRSWR 所做限制的调査在设计 
上都很复杂，并需要特别的分析性考虑。这本书回顾了由复杂抽样调査引起的 
分析问埋，为分析策略提供了人门介绍，并利用某些可用的软件进行了实例阐 
释《我们讨论的重点在于使用抽样权重以校正不同的代表性，以及抽样设计对 
抽样方差估计的影响，我们也对权重的产生和调整程序做了一些讨论。但许多 
其他重要的处理非抽样误差和缺失数据的议题并没有在本书中得到充分说明。 

本书介绍的最基本的方法是分析复杂调査数据的传统方法。这种方法现 
在被称为基于设计的(或基于随机化的)分析6另一种不同的分析复杂调査数 
据的方法,是所谓的基于模型的分析。正如统计学的其他领域,近些年来基于 
模型的统计推断在调査数据分析中巳引起了更多的注意„这些构造模型的方 
法在调査数据分析的不同步骤——定义参数、定义估计值和估计方差一中得 
以介绍;但是，并没有普遍被接受的模型选择或使某个特定模型有效化的规则。 

然而，对基于模型的方法的理解对调査数据分析者扩充基于设计的方法来 
说非常重要。在某些情况下，这两种方法会产生相同的结果，伹在其他情况下 
结果却 不同。 基于模型的方法可能在播述性数据中没什么作用，但在推断性分 
析中却是有用的。我们将在适当的地方介绍基于模型的视角，并进一步提供与 






合并成不同的程序包，包括 logistic 回归和生存分析。这些程序将在这个版本 
中用实例加以介绍。这些程序可能比其他标准软件更容易被错误地使用。本 
书所讨论的雇目和议题将为避免调査数据分析中的陷阱捱出一些指导 原则。 

在我们的叙述中，我们假定读者在一定程度上熟悉诸如简单随机抽样、系 
统抽样、分层随机抽样和简单二阶段整群抽样等抽样设计方法。对这些设计方 
法详细的描述可参见 Kalton(1983> 和 Lohr(1999> 的著作。我们还假定读者对 
标准统计方法以及某种标准统计程序包如 SAS 或 STATA 有大致的了解。 






第 2 章 I 抽样设计和调查数据 


中在样本 里面。 这是对某< 
的推导中的基础。其次，如 


我们对调査数据的考虑重点关注满足两个基本要求的样本设计。首先，我 
们只关心概率抽样，其中总体里面的每个成员均有已知的不等于0的概率被选 
k 对某个给定的设计把统计理论应用到调査估计置的特性 
欢， 如果某个样本要从某个总体中被抽取出来，就有必要 
建立一个罗列了合适抽样单位的抽样框，且这些抽样单位必须涵兼总体中的所 
有成员。如果罗列所有总体成员是不可行或不现实的，那么某些总体成员的集 
群也可用做抽样单位。比如，建立一个包括美国所有家庭的淸单是不切实际 
的，但是我们可以在几个不同的阶段选择样本》第一个阶段，随机选取郡》第二 


个阶段，在每个被选中的郡内抽取普査区;第三个阶段，在每个被选中的普査区 
内选取街区6然后在最后的选择阶段，只需要对被选中的街区罗列家庭淸单即 
可^这个多阶段设计保证了总体成员都有已知的且不等于0的被选中 概率。 








SRSWOR 相比 SRSWR 给出的抽样方差更小。伹是，对于只从总体成员中选取 
—小部分的大型调査来说，这两种方法实际上是一样的。我们将在本书中使用 
SRS 一词表示 SRSWOR， 除非另有说明。 

SRS 设计被进一步调整以适应其他理论或实际的考虑。常用的实际设计 
方案包括系统抽样、分层随机抽样、多阶段集群抽样、 PPS 抽样(按规模大小成 
比例概率抽样)和其他受控制的选择程序。这些更实际的设计在两个重要方面 
偏离了 SRS. 首先，总体成员被选中的概率(以及由个体成员组成的不同集群 
的联合被选中概率)可能并不相同。其次，抽祥单位可能不同于我们感兴趣的 
总体成员。这些偏离使常用的估计方法和方差计算方法复杂化，而且如果没有 
使用恰当的分析方法，可能会导致估计和统计检验的偏差。我们将用几个具体 
的抽样设计详细考虑这些偏离情况，并检验它们对调査分析的影响。 

系统抽样是替代 SRS 的一种比较常用的方法，其原因在于它的简单性。它 
在一个随机起始点(在1之间)之后，选择每个处于第 i 个位置的成员。其 
上的任务很简单，而且我们很容易对该程序进行检査，伹是要通过检验结 
:核实 SRS 却很困难。它常用于多阶段抽样的最后一个阶段,如当实际调査 
者被指示要从某个街区的住宅淸单中选择预定比例的(住宅)单位时。系统抽 




且抽样间距正好与清单的循环周期相吻合时,系统抽样就可能导致不真实的估 
计。比如，如果我们对到某个诊所的每隔40个病人中抽取1个,而平均每天的 
病人流量几乎就是40,那么得到的系统抽样将只包括那些 在一天 中的某个特定 
时间到孩诊所的人。这样的样本可能无法代表这个诊所的所有病人。 

再者，即使当淸单是随机排序时，与 SRS 不同，总体成员的不同的集合也可 


























整到可知的总体构成水平，从而使样本更具总体代表 性* 通常,为了利用人口 
普査数据，在事后分层中常使用诸如年龄、性别、种族和教育等人口统计学的变 
量，这种调整需要使用权重和不同的方差估计方法，因为在事后分层设计中， 


阶层的样本规棋是一个随机变量(在数据收集完之后才决定的）。 

集群抽样是一种实用的调査方法，因为它以由不同的成员构成的组(集群） 
为单位，而不是直接对个体成员进行 抽样。 它简化了构造抽样框的任务，降低 
了调査成本。正如前面所讨论的，通常使用的是一系列不同阶层的地理集群。 


E 行抽样。1 
，通常使用6 

鄉样中，除了在最后的抽样阶段， 

1。当成员的数量在不同的集群间; 


相同。但集群规模不同的简单随机抽样会 4 

更大集群中的成员更有可能被选中。此 外，; 

的和实地的调査步骤，比如，对特殊少数人I 

不同规模集群使估计过程变得复杂。 

在不同规模集群的一步集群抽样中选再 
邊以与集群规模成比例的< 


I相同的时候，估计过程也与 SRS 

J 简单随机抽样会导致处于更小集群中的成员比处于 

、，集群通常被分层以实现某些调查目 

.口集群的过 取样。 不成比例分层和 


芦中选取自我加权的成员样本，其中一个方 
诚比例的概率选取集群 (PPS 抽样)。但是，这需要知道集群 

的真实规模。因 

计到的规棋成比例的 (PPES 抽样)。比如，在3 
中，病床的数 量可以 用来测量医院规模， PPES 抽才 
调而不同。也 


E 时并不可知，所I 
:如，在某个以医 E 


样本量将因初级抽样单位 (PSU) 的不同而7 


而是随着样本的改变而改变的。所以,样本量 —— m 
是一个随机变量，因此样本均值成为两个随机变量的I 
比率变量，需别的策略进行方差估计。 


I 比率。 这种类型的变量， 


_査数据的属性 

如果我们要从样本推断总体，样本选择过程就是推断过程中一个不可或缺 
U 部分，且调查数据必须包含选择程序各重要层面的 信息。 考虑到多数社会调 








当以下某种自加权设计被使用时，我们也可能会对未加人权重比较放心。 
—步集群抽样中正确的 PPS 抽样会产生一个自加权成员样本,就像在 SRS 设 
计里面一样 • 自加权也可以在两步设计中实现，即当在第一阶段中使用了正确 
的 PPS 抽样，且在每个被选中的 PSU 中选取固定数量的成员时。如果简单随 
机抽样在第一阶段中使用，且在第二阶段选取固定比例的成员，也会出现相同 
的结果 (Kalton， 1983,第5章和第6 章)， 伹在实际中 * 自加权特征会遣到无应 
答和抽样框中的可能误差的破坏。这种非计划中的自加权可能产生偏差，但这 
种偏差却不大可能通过对样本数据进行检验来评估。事后分层和无应答调整 
是用于减少这种误差的两种方法。事后分层涉及权重的分配，以把不同子群中 
的样本比例调整为与相同子群的总体比例相一致 # 无应答调整对那些参与了 
调査的人提高了权重，以弥补那些具相似特征但没有应笞 的人。 因为要通过加 
&应答和事后分层调整，所以即使当自加权设计被应用时权重的使用 


权而实现无应答和事 
仍几乎不可避免， 

抽样设计影响了 
些我们熟悉的、在统计教科书中 
差膊 公式，我们就能发现它们 
E 假设了成员的选择 
以修正以调整其他3 


科书中出现且内置于大部分计算机程序包中的标准误 
S 现它们都是基于 SRSWR 设计的6这些公式相对比较 
简单，因为在假设了成员的选择具独立性之后，成员间的协方差为0。但对这些 
公式如何加以修正以调整其他复杂的抽样设计却并不淸楚。 

为了更好地理解对方差公式进行调整的需要,我们对几个不同的抽样设计 
检验一下方差公式^首先考虑从 SRSWOR 设计中得到的样本均值的方差 。那 







成员的选择已经不再独立于另一 ^ 成员的选择。由于条件不允许重复选择，在第 
i 个和第 y 个样本颇间# fc— 个负的协方差 [-crV(N-l)]. 合并_ 1>乘 
以协方差， SRSWOR 样本均值的方差就变成了 这个比 SRSWR 中 

的方差小，是其 (N-»)/(N-l) 倍•把 o 2 的无偏估计值用 [(N-l>iVAO 代 
#,SRSWOR 样本均值的方差估计值就变成 

V(y) = £(1^/) [2.1] 

其中 * 2 = H (农一5>2/(«_1)， /-»/N 0 (N-n)/<N-l) 和 (1 一 /) 两者 
赫为有限总体校正 <FPC〉 因索 • 在一^大总体中，协方差会非常小，因为抽样 
部分非常小 • 因此 SRSWR 和 SRSWOR 设计会产生几乎相同的方差，这两种 
程序在所有实际目标中可以被看做是相同的。 

分层抽样通常被认为是一个更有效的设计，因为如果使用恰当，它给出的 
方差比类似的 SRS 给出的方差 更小。 因为阶层间的协方差为0,所以样本估计 
值的方差是从阶层内的变异情况一以阶层的样本量和阶层权重为基础结合 
起来一推导出来的。分层样本方差的取值取决于阶层样本量的分布。一个 
最优(或者 Neyman) 分配产生的抽样方差要小于或等于基于 SRS 而产生的方 
差，但在极端少数的情况下也有例外。对其他不成比例的分配来说，当阶层内 
的有限总体校正因素不能被忽视时，抽样方差可能比那些基于 SRS 的方差要 
大。因此可以认定，相比 SRS， 分层的方法总会降低抽样方差。 

集群抽样设计常常导致比从 SRS 中得到的方差更大的抽样方差。这是因 
为在自然形成的集群内部其成员通 f 比较相似，因此在集群内各成员间产生一 
个正的协 相关。 集群内的同质性用组内相关系数 (ICC) 一集群内所有珂能的 
成员配对组合间的相关性——测量。如果集群是随机形成的(即如果每个集群 



数据中，这些要求的原因我们也会在下文中详细论述。 

复杂调査中方差计算的一个复杂情况来源于权重的使用。因为任何加权 
后方差估计之分母中的权重总和并不固定，反而随样本的不同而改变，所以该 
估计就变成了两个随机变量的比率。一般来说，比率估计值是有偏差的，但如 
果权重的变化相对较小或样本量比较大，这个偏差就可以忽略不计 (Cochran， 
1977,第6章)。因此，在大型社会调査中，比率估计的有偏差问题并不严重。但 
是，因为这个偏差，使用均方差——方差和偏差平方的和——比使用方差更合 
适。 但因为这个偏差通常是可忽略的，因此在本书中我们使用“方差”一词，尽 


调査数据的另一种不同看法 " 

迄今为止，对调査数据厲性的描述是从基于设计的视角展开的——即样本 
数据是利用某个特定的样本选择设计方案从一个有限的总体中抽取的观察值。 
抽样设计明确了每个潜在样本的选择概率，然后某个合适的估计方法被选中用 
以反映这种设计，如概论中所述，基于模型的视角提供了样本调査数据的另一 
种看法。有限总体中的观察值被看做是从某个模型中产生的随机变量(朦从某 
种概率分布的随机变量)的现实对应值。这假定的概率模型连接了样本中的单 





体是拜本中的观测值的和以及没有包含在样本中的观澜值的和，也就 是^ = 
S 相 基于同均值的假设，全及总体的估计值可以写成殳 =矽 
+ (N-n)y = Ny , 其中夕是在该模型下未观测到的观察值的最优无偏估计值。 
结果它与基于设计的方法中的扩展估计值相同，即 f = (N/«)S-=l^=Ny, 
其中 (N/«> 是抽样取重 (SRS 中选择概率的倒数)。这两种方法都得出了同样的 
方差估计值 (Lohr， 1999,第 2. 8 节〉， 

但是，如果采用的是不同的模型，方差估计值就可能不同。比如，在 SRS 比 
率 [1] 和回归估计的情况下，假定的模型是 Yi »/Jri +«，其中I代表一个随机 
变置，农是一个辅助变量，对这个辅助变量来说全及总体是已知的。在这个模 
型下，全及总体的线性估计为 y-E ies y*+S i iS yi =矽+妄 S 掩〆 “其 
中第一部分是从样本中来的，第二部分是基于假定的模型对没有观察到的单位 
作出的估计 • 如果我们把备取值为样本比串夕/5,那么 就有爹 =矽+ 
= f 其中 x 是: c,- 的全及总体。这就是 y 

的比率估计。如果我们把$取值为估计到的回归系数，那么我们就得到了一个 
回归估计。虽然从基于设计的角度看比率估计被认为是轻微有偏的，但从基于 
模型的推理角度看如果棋型正确它就是无偏的。 

但是，从基于模型的方法中得到的方差估计值与从基于设计的方法中得到 
的稍徽有所不同。基于设计的预计全及总体的方差估计值为 VdCY ) = 

“- #)( 咢基于棋型的估计值为 v »< r > - 

( i - f ) (咢) 其中 ， 是全及样本 . x 是辅助变置 
的全及总体 (Lohr， 1999,第 3. 4节)， 

当(3>方 和而 之间的关系是过原点直线的， （b)：y, 关于这条线的方差是与 
工 i 成比例时，比率估计模型是有效的。当: w 和々 之间的相关性 小于心 的变异 
系数与: y; 变异系数的比率的一半时，比率估计被认为差于(没有辅助变量的)扩 




展估计 (Cochran, 1977,第6章)。因此，在调査分析中使用比率估计要求对模 



要为不同的估计选择不同的辅助变量。 


要把基于模 S! 的方法应用到实际问题中，我们必须能够建立一个适当的模 
型。如果模型是错的，那么基于模型的估计就是有偏的。在抽样中使用基于模 
型的推断时，我的需要通过详细分析数据来检验模型的假设。在许多情况下， 
检验假设是困难的。棋型的恰当性在某种程度上说是判断力的问题，而且适合 
某个分析的棋型，可能对另一个分析或另一个调査并不 合适。 




I 分析调查数据的复杂性 







权后的样本均值。在 SRS 中，它可 《1 化为 <N/») J} yi /N = y ^ 表示样本均值 
是总体均值的估计值。但是，即使在不等概率设计中，各成员的权重也不相同， 
估计值仍然是全及总体的加权总和和总体均值的加权平 均数。 

虽然扩展权重看起来适合全及总体的估计，但它可能会给样本均值和其他 
统计测量带来重大影响。比如，在列联表中用扩展权重的总和代替以样本规模 
为基础的相对频数可能会夸大数据中的置 信度。 要处理这个问題，可以把扩展 
权重按比例缩小以生成相对权重 (ru;): •，即用扩展权重除以扩展权重的均值， 

WiAS, 其中， w= 2 样本中每个成员的相对权重之和等于对 SRS 

设计来说，每个成员的 (nvh = 1. 用相舰重进行加权后的全及总体的估计为 
Y=wS Cnvhyt = CN /»)^ yi =Ny [ 3 •幻 

注意在方程 3. 2 中，相对权重被乘以扩展权重的平均数，对 SRS 得出的简 
化估计值与方程 3. 1 —模一样。因此，在对全及总体进行估计时，扩展权重的使 
用比相对权重更简单 • 相对权重在分析性研究中更合适，却不适用于估计总体 
和计算有限总体校正值。 

大部分政府部门和调査机构提供的公开调査数据使用的都是扩展权重，很 
容易转化为相对权重 * 但这种转化并不是必须的，因为许多便于用户使用的调 
査分析统计程序会謂当的时候自动对其进行转化。 

我们来分析一下分层随机抽样设计中扩展权重的使用。在这种设计中，具 
有 N 个成员的总体基于某个变量被分成 L 个阶层，每个阶层分别包含 Nj， 
N 2 , …， Nl 个成员。 从这些阶层中，分别 有沏个 (A=l， 2,…， L) 成员从隼 A 
个阶层中被抽取 出来。 当每个阶层的抽样比例相同的时候，这个分层抽样设计 
便具有自加权的特征。如果一共有200个成员从两个阶层 （M = 600和 N 2 = 
3400) 中按比例被抽取出来，那么抽样比例/ = 200/4000 = 0. 05。按这个比例 
选取(从每个阶层中各选取5%的 样本〉 的结果会产生两个样本 m = 30和《 2 = 
170,因为 /I = 30/600 = 0.5, / 2 = 170/3400 = 0.5. 因此加权的方案与 SRS 
设计中的结果完全相同。 








在不成比例分层抽样设计中情况则稍微不同。比如，如果这200个样本成 
员在两个阶层中平摊，那么/I (=100/600) 和/ 2 (= 100/3400) 的取值就不相同， 
这两个阶层的成员其扩展权重也不相同，分别为 則 < = 6 和抑 i = 34。扩展权重 
之和在第一个阶层内为600,在第二个阶层内为3400,总和4000等于总体规模。 
扩展权重的均值5= (100X6+100X34)/200 = 20,因此相对权重之和在第一 
个阶层内为30,在第二个阶层内为170,两个阶层总和等于样本 规模。 值得注意 



进行加权(即如，标准程序)。在阶层1内，扩展权重和相对权重两 
者的总和都分别等于它们各自的全部总和的15%,而且第一阶层包含的成员的 
数量也等于所有总体成员数量的15%. 

虽然我们在介绍抽样权重时用的是 SRS 和分层抽祥设计，但同样的概念可 
以很容易扩展到更加复杂的设计的使用中。总的来说，抽样权重是选择概率的 
倒数,虽然我们经常会通过亊后分层和无应答调整的方法对它做进一步的调 
整。对毎个样本成员賦予抽样权重有助于对所有的抽样设计建立一个综合的 
估计程序。一个普適的规则是，在调査数据分析中所有的估计都以加了权的统 
计量的形式进行。除了估计总体和计算有限总体校正值，这些权重的规棋在估 



量只有少数几个的时候，事后分层的方法效果较好。第二个例子吿诉我们在追 
踪调查中，我们可以通过使用 logistic 回归禊型，对许多变量的不同的损耗率进 
行调整。 


用事后分层的方法加权 






人口中获得综合社会信息 < 
— 自加权样本。奔 
& Smith, 1985). | 


I..该调3 
、每一 


1473,而被选中的家庭内的扩展权 
重的乘积等于样本中个体成员的 J 
‘分析 GSS 数据，我们只1 
f 相同的被选中的概率。个体成 J 
=人的数量除以平均每个家庭内! 
左个权重反映了在维持样本规模I 


•被抽 中的家庭里面随机选取一个成年人 (Davis 
35)。最终的数据总共包括1473个观察记录可供分析使用 • 对家 
庭层面的数据来说，扩展权重可以计算为等于美国所有家庭的总数量除以 
t 则等于该家庭内成年人的数量。这两种权 
5员的扩展权重。 

为了分析 GSS 数据，我们只箝要集中讨论家庭内部的权重，因为每个家 
庭都具有相同的被选中的概率。个体成员的相对概率可以计算为等于这个家 
:庭内成年人的数量(后者为2852/1473 = 
上，一个成年人被选取到样本 

中的概率。 

为了使样本结构与总体结构一致，我们需进一步对这个片 
样可以提高估计的准确度，同时也可把无应答和样本选择偏差降低到只与人口 
构成相关的程度/ 2 ]如表 3. 1所示，调整因素的产生是为了使样本中个体的分 
布状况在年龄、种族和性别等方面符合1984 
列显示美国人口普査局估计6 
示在对应的人口分类中，在 

的是对应的分布比例。调整因素是第1列和第3列数宇的比。调 
于把调整因素乘以相对权重，这样调整后的权重的分布就与人【 


I•这个权重进行调整。 

I择偏差降低到只与 J 
因素的产生是为了使样本中个体的： 
184年美国人口总体的分布情况。第 
:局估计的分年龄、种族和性别的人口分布状况。第2列显 
j 中，在选中的所有家庭里面加权后的成人数量，第3列显示 
比。调整后的权重等 
t 与人口总体的分布 

f 表明，如果没有进行调整 
!，而非白种45—54岁男 t 








Imfdrpm 














在追踪调查中调整权重 


追踪调査在社会科学研究中很常用。但遗憾的是，对所有的初始受访者 
进行持续的跟踪几乎不可能。他们中的某些人可能巳经去世、撅迁，或者拒 
绝参与追踪调査。这些事件并不是随机分布的，在追踪调査中不同的损耗率 
可能导致选择 偏差。 基于一些人口特征变量，我们可以侓在事后分层中那样 
采用相同的方式进行调整，但我们可充分利用初始调査中大量的潜在估计变 
量进行追踪调査中的损耗调整。分层的策略可能并不是很适合大量的估计变 
量，但是 logistic 回归模型提供了一种方式以包含若干变量《以初始调査数据 
为基硇，我们可以建立一个 logistic 回归模型，通过使用初始调査中的一系列精 
心挑选过的预测变量和常用的人口特征变量来预测损耗(二分类变量)。然后， 
基于原始样本中受访者特征的 logit 估计值可以用于调整在追踪调査中每个受 
访者的初始 权重。 实际上，这种方法可以通过不同程度地调髙那些在追踪调査 
中成功接触到的人的权重，来弥补那些丢失掉的受访者，以此排除选择偏差，以 
使之降低到只与模型中的变置相关的程度。随着模型使用更多恰当的变量，损 
耗调整可以比初始调査中的无应答调整更加有效。对由“追踪调査中的丢失” 
带来的无应答(或其他类型的无应答)进行校正的亊后分层并不能保证一定能 
改善估计。但是，如果“追踪调査中的丢失”与在调整程序中用到的变量相关， 
那么调整后的估计应该比未调整的估计更好。 

我们来看某个社区精神健康调査 （ECA 调査的其中一个场所）的例子。 
只有 74. 3%的初始受访者在第一轮的年度追踪调査中成功受访。这个损耗 
程度太大以至于我们没法忽略不计。因此，我们挑选了一些预测变置，对损 
耗 (1= 丢失，0=受访〉进行了 logistic 回归分析，结果如表 3. 3所示。卡方值 
说明，模型中的变景与损耗显著相关。如表 3. 3所示，效果编码需要每个变量都 
省略其中一个取值。基于估计到的 beta 系数，对每个受访者都计算了 logit 估 


tHICA,, f=l, 2 ，…， 》)。然后这些值被转化成损耗的预测比例 p, = l/(l 
+ 通过把在追踪调査中丢失的人的权重设为0,以及把成功受访者 





正如表 3. 3 所示，对保留下来的成员调整后的权重总和为300172,只比初始调 
査中的权重总和大59,这个数据意味着这种方法的使用很合理(如果调整后的 
权重总和与初始调査中的权重总和之间存在很大的差异，调整过程就可能值得 
担忧)。这些调整后的权重再次被调整以与初始调査达到一致。为了说明使用 
损耗调整权重的作用，如表 3. 3所示，我们对6种精神障碍的流行率分别进行了 
使用和不使用损耗调整权重这两种不同的估计。我们可以发现，使用了调整权 
重后，所有障碍(由 DSM-III 定义的 障碍〉 的流行情况比没有调整时的情况大约 









评估精确度的得失：设计效应 



如前一章所述， SRSWOR 样本均值的方差等于 SRSWR 样本均值的方差乘 
以有限总体校正因素 （ 1 _ / ). 因此， SRSWOR 抽样方差与 SRSWR 抽样方差 
的比率等于 （ 1—/)，反映了(与使用 SRSWR 相比〉 使用 SRSWOR 的影响。这 
个把某个特定抽样设计中某个统计值的方差与 SRSWR 中的进行比较的比率被 
称为那个统计值的设计效应。它被用于评估与 SRSWR 设计方案相比，现有使 
用方案中的样本估计其精确度的得失。设计效应小于1意味着若要得到与 SR- 
SWR 相同的精确度，需要更少的观察值《设计效应大于1意味着要得到与 SR- 
SWR 相同的糖确度，需要更多的 观察值 * 在 SRSWOR 设计中，设计效应小于 
1,但当抽样比例很小的时候接近于1。由于研究者习愤上常用 SRSWOR 代替 
SRSWR, 因此他们倾向于以 SRSWOR 而不是 SRSWR 为基础来计算设计效 
应。此外，在复杂调査中，设计效应的计算通常基于 SRSWOR 设计中加权后统 
计值的 方差。 我们在后文中也将如此计算。 

把设计效应这个概念与样本规模结合起来，有效的样本规模可以定义为实 
际样本规模除以设计效应。如果某个抽样设计的设计效应大于1,那么实际上 
为了统计分析样本规模就会减少，因此导致更大的抽样误差。换言之,当设计 
馳大于1时，有效样本规模小于实隨本规模。 

我们来检验一下更加复杂的抽样设计中的设计效应。大家已经知道分层 
随机抽样中抽样误差的性质和估计情况，以及在哪些条件下分层会产生比 SRS 
更小的方差《但是，分层通常与其他的设计特征一起使用，如阶层内不同阶段 
的集群 抽样。 如前面讨论的，集群会增加抽样误差。在许多实际的抽样设计 
中，分层的作用会因集群的作用而减弱。可借我们无法在理论上分别从分层和 
集群的特征中评估设计效应，反而必须从数宇上大致地判断它们的联系效应。 

接下来的例子说明了在一个相对简单的情况下设计效应的计算.考虑一 
个单步骤集群抽样，其中所有的集群大小规模一样。假设在一个高中学校有 N 




SRSWOR 样本(样本规模为的均值方差 [9(5) =盖 (1 一/>，方程 2.1] ， 
那么这个集群抽样的设计效应为1 + (M-l)jS. 

当 ICC = 0时，设计效应为1;当 ICC>0 时,设计效应大于1。如果集群 
的形成是随机的，那么 ICC = 当每个集群内部所有成员有相同的取值时， 
ICC= 1。社区调査中用到的大部分集群由相同地区的住宅构成，这样对该调 
査中许多变量产生的 ICC 是正数。通常来说，社会经济变量的 ICC 比人口特征 


变量如年龄性别等的 ICC 大。 

对更加复杂的抽样设计的设计效应进行评估并不是一个用统计教科书中 
的公式就可以完成的例行任务》相反,它需要特殊的技术,而这些技术要使用一 


些不常见的 策略。 下一章将会介绍用于估计复杂调査中统计值的抽样方差和 


不同调査的设计效应的几种策略。 





调查数据分析中抽样权重的使用 

如上面所讨论的，抽样权重可用于计算点估计，所有的点估计都表现为加 
权后的统计值的形式。从上述讨论中可见，抽样权重的这种用法使得抽样权重 
的创建和调整显得很有道理,尤其是对描述性分析来说。但是，在分析性研究 
中抽样权重的使用并不如在描述性分析中那样淸楚。如第2章最后一部分所 
述，关于调査数据有《种不同的视角。从基于设计的角度看，抽样权重的使用在 
描述性和分析性研究中都非常重要。推论是以对有限总体进行重复抽样为基 
础的，而用于推论的概率结构是由表明被包含在样本之中的随机变童界定的。 
但是，从基于模型的视角看，样本选择方案对于在某个具体的模型下进行推论 
是无关紧要的》如果总体中的观察值确实符合模型，那么只要选择概率只通过 
模型中的自变量 ® (取决于该模型中的因变量），抽样设计就不会有任何影响。 
许多学者巳经对在哪些条件下做推论时可以忽略抽样方案的作用做了大量的 
研究 (Nordberg， 1989, Sugden & Smith, 1984). 而且自20世纪70年代初期 
起，很多调査统计学家就已经针对这两种不同的视角进行过争论 （Brewer, 
1999; Brewer S- Mellor, 1973 } Graubard &. Korn，1996, 2002； Hansen, 
Madow & Tepping, 1983, Korn &. Graubard, 1995a, Pfeffennann, 1996, 
Royall, 1970} Saradai, 1978, T.MF. Smith, 197$, 1983). 

好的调査数据的分析需要对这两种视角有一个全面的理解,并且还要考虑 
到某些实际问题，尤其是在社会调査中。基于模型的方法与其他统计分析领域 
曰益增多的模型推论一致，而且确实提供了一些理论优势。基于模型的估计可 
以用于相对较小的样本之中，甚至可用于非概串样本中。此外，基于模型的分 
析可以用标准的统计软件如 SAS 和 SPSS 执行，而不霈要依赖如 SUDAAN 及 
其他本书所提及的调査软 件包。 但是，基于模型的方法假定该模型正确地反映 
了自然的真实状态。如果模型设定是错的，那么分析就会有偏差，对数据的解 





释就会 有误。 可惜在社会调査中很难对总体中的所有观察值建立用理论推导 
出来的棋型。此外，棋型中相关变量的缺失在调査数据的二手分析中也是一个 
大问题，因为研究者并不能获得所有的相关 变量。 因此,基于模型的推论其主 
要的挑战是建立一个符合分析目的的正确的模型。 

我们已经知道加权后的分析会受到具有极大权重的观察值的严重影响(极 
大权重的产生经常来自无应答和事后分层调整，而不是选择概率)，此外，加权 
的另一个局限在于方差的增加。通常，当权重的变异较大时方差会增加很多。 
如果实际上并没有减少偏差的必要，那么使用加权后的估计就会损失一些东 
西，相比未加权分析，加权后的分析也就会变得低效 e Kom 和 Graubard(1999, 
第4章)讨论了处理总体参数的加权和未加权估计的不同问题，并提供了 一种检 
验加权估计的低效性的方法。他们建议，如果低效性并不是严重到不可接受， 
那么就用加权后分析，以避免未加权分析中的偏差》如果低效性太严重以至于 
不能接受,那么就用未加权分析，并用调査设计变童 一 ~包括权重——以充实 
模型从而减少偏差。但是，把设计变量结合到模型之中通常会出现问题，因为 

把设计变量作为附加的解释变量放到模型中可能会与科学的分析目标相矛盾。 

比如，当分析的目标是检验卫生措施与风险系数两者的相关性时，把设计变量 
放在模型中可能会干扰这两者的相关路径。 

在复杂的大型调査中，通常不可能把所有的设计信息包含在模型之中，尤 
其在对抽样权重进行了无应答和事后分层调整后 (Alexander，1987). 把设计 
变量放到模型中的方法还有另一个操作性问題，那就是数据常常没有相关的信 
息。并不是所有与设计相关的信息研究者都能得到。大部分公开的调査数据 
只提供初_样单位 (PSU〉 ,而没有次级集群单位(如普査小区或者电话交换 
台)，出于保密性考虑，他们通常不可能提供次级抽样单位的信息。 

在基于模型的分析中，我们必须避免可能的模型设定错误和相关解释变量的 
缺失。抽样权重的使用(基于设计的分析)可为此提供避免错误的模型设定 
(DuNfoudiel & EXsican, 1983; Pfeffermann &. Homes, 1985). Kott(1991> 指出，在 
线性回归中需要使用抽样权重，因为在大部分二手分析中对调査数据解释变量的 
选择具有局限性.本书第6聿最后一节将对使用抽样权重的利弊做进一步讨 ife。 






I 方差估计的策略 


对调査统计值进行方差估计是很复杂的,不仅由于抽样设计的复杂性(如 
前面章节所述)，也由于统计值的形式。即使是在 SRS 设计中，某些统计值的方 
差估计也需要非标准化的估计技术。比如，标准教材明显没有涉及中位数的方 
差，而且比率估计值的抽样误差(参考注释 1) 也很复杂，因为分子和分母同时都 
是随机变童。某些在标准教科书中没有提及的方差估计方法就有足够的灵活 
性,可以同时顾及抽样设计的复杂性和统计值的各种不同的形式。本聿所介绍 
的这些常用的方差估计方法包括:复合抽样，对称重复抽样 (BRR)， “折叠式”重 
复抽样 (JRR) ，自主抽样法和泰勒级数法。 

复合抽样：一神通用的方法 

这种方法的根本原理是通过选取一系列复合子样本而不是单个样本来辅 
助方差计算。它要求每个子样本都用同一个选择方案独立地被选中。然后用 
同样的方法对每一个子样本进行估计，这样我们就可以通过这些独立的子样本 
估计值的变异情况，对基于所有子样本的总体估计的抽样方差进行估计 • 这与 
第2章中重复系统抽样的原理一样。 

对于参数 t； 的 t 个复合样本估计值幻，《 2 ，…，《 4 的均值(5〉，其抽样方差 
可以通过下面这个简单的方差方程估计出来 (Kalton， 1983, 51) 

v(«) = S (Mi C4,1] 

这个估计可以用于所有抽样设计为独立复合样本得到的所有样本统 















中得到的样本均值通常用做复合样本均值的平均数。这些偏离根本原则的做 
法会影响方差估计，但在大型调査中，这种偏差应该是可以忽略的 （Wolter， 
1985： 83—85)。 

作为美国国立精神卫生研究院1站4年 ECA 调査的一部分，在康涅狄格州 
纽黑文县举行的社区精神卫生调査 （E& Lee，Forthofer, Holzer 8, Taube, 
1986) 是复合抽样的一个典型的例子。这个调査的抽样框是按地理位置排列的 
居住电网 淸单。 这个调査把两个居住单位作为一个集群，随机选取起始点，以 
61户为间距进行系统抽样。样本中的这一连串集群随后按顺序分配给12个子 

样本。这些子样本用于在长时间的筛选和访问中辅助数据的调度和中期分析。 

其中10个子样本用于社区调査，其他2个用于其他分析。这10个复合样本在 

此用于说明方差估计的程序。 

这些子样本并没有严格遵循独立复合抽样的基本原则，因为除了第一个随 
















虽然复合抽#设计为我们提供了一种易于 t 携的方差估计方法，但为了获得 
合格的统计推论的精确度，还必须要有足够数量的复合样本才 可以。 然而，如果 


复合样本的数量很多而每个样本的样本量却相对较小，就会严重限制在每个复合 


样本里面使用分层。更重要的是，在复杂抽样设计中使用复合抽样是很不切实际 


的。因此，复合抽样设计很少在大型的分析调査中使用。相反，复合抽样的原理 
常在数据分析阶段被用于估计方差。这种尝试促使了方差估计的拟复合抽样方 
法的出现。下面要讲的就是基于这种拟复合抽样的原理而产生的两种方法。 

对称重复抽样 


对称重复抽样 (BRR) 是复合抽本 
个阶层内都有两个初级抽祥单位 (PSUs) 被选取。配对选择设计代表了分层的 
最大化使用并允许对方差进行计算。在这种情况下，两个抽样单位之间的方差 
等于他们之间差异的平方的 一半。 为了应用复合抽样的原理，我们首先把样本 
分成随机的组别以形成拟复合样本。如果是分层的设计，需要所有的阶层都能 
在每个拟复合样本中出现，在一个分层的配对选择设计中，我们只能建立两个 
拟复合样本:第一个从每个阶层的两个抽样单位中选出其中一个;每个阶层中 
劂下的另一个抽样单位则组成第二个拟复合样本(补充样本)。每个拟复合样 
本几乎都包含了总样本的一半。 

把 e 2代人方程 4* 1,我们可以对这两个复合样本估计值《'和《〃的均值的 
抽样方差进行估计，通过： 






放回抽样而获得的，虽 
到无放回样本中时，会 
计，因为在抽样比例很 
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f 计，因为某些 
E 统计值来说’ 


段的抽样信息，并不需要这些复杂设计的其他详细的特征 信息。 

如果 BRR 要用于配对选择设计之外的其他方案，就有必要对数据结构进 
行调整以适应这种方法。在许多多阶段调査中，分层的数目被最大化了，最终 
只从每个阶层中选取1个 PSU。 在这种情况下 ，PSU 之间可以进行配对以形成 
合并层从而使用 BRR。 这种方法通常会导致对方差的某种过高估计，因 
阶层间的变异性现在被包含在阶层内的计算结果之中了。对线性统计< 

如果这种合并是明智而审慎地进行的，那么这个问题就不是很严重》但是，对非 
线性统计值，通常不建议使用这种合并方式 (Wolter， 198匕 48). 稍后介绍的泰 
勒级数法可以用于非线性统计值的估计。还有一种对每个阶层内包含的3个 
PSU 建立正交平衡的方法，但它并没有被广泛使用 (Gum«y & Jewett, 1975). 

现在我们把 BRR 这种方法应用到1984年的美国 GSS. 正如前一节所述， 
它用的是多阶段选择设计。第一阶段的抽样从84个阶层——郡级地区或郡级 

地区群——中各选取一个 PSU。 前面的16个阶层为大都市地区，被定为具有 

自我代表性(或者自动包含在样本之 中〉。 为了使用 BRR, 这84个阶层被合并 
成42对拟阶层。因为数据中不具自我代表性的 PSU 的编号服从阶层的地理排 
序，因此配对是以 PSU 的编码为基础按顺序进行的。之后，再把这16个具自我 
代表性的阶层合并成8个拟阶层，而剩下的68个不具自我代表性的阶层则被合 
并成34个阶层，但是，对这些具自我代表性的阶层进行的配对方式错误地包括 


I的异质性。为了排除这些，而仅仅只包 i 
t 性，这些在每个具自我代表性的拟阶层 f 


人42个拟阶层中产生的半样本的复合样本,我们使用了一^ 


>。这个矩阵由数字 
t 行对应复合样本，4 


,42列对应拟阶层 h 0表示包身 


















为了对从全样本中产生的统计值进行方差估计，我们首先需要对这 44 个复 
合样本和补充复合样本分别计算出我们关注的统计值。在计算这些复合样本 
的估计值时，我们使用了调整后的抽样权重。表 4. 3显示了对这44个复合样本 







和他们的补充复合样本分别估计出的同意“攻击”的成年人的比例•总体比例 
为60.0%。由方程 4* 3估计出来的总体比例的抽样方差为 a 00023U 把这个 
结果与 SRS 设计中该比例的抽样方差 [«/(«-1)-0. 000163,忽略 FPQ] 进 
行比较，可知设计效应等于 1. 42( = 0.000231/0.000163), 这个设计效应意味 
着从 GSS 中得到的比例估计值的方差比从具相同样本规模的 SRS 中得到的方 
差大42%,从方程 4. 4得到的方差估计值也类似。 

综上所述， BRR 使用了拟复合抽样的方法来估计抽样方塞，它主要是为配 
对选择方案而设计的。它也可以用于某些通过配对阶层而只从每个阶层中选 
择一个 PSU 的复杂的调査，但是这种配对方法必须是明智而审慎的，而且要考 
虑到实际的样本选择程序 • 在大多数可用的 BRR 的应用软件包中，对于复合 
样本中被选中的 PSU， 其观察值的抽样权重被增加至两倍，以弥补没有被选中 
的那一半 PSU。 此外， Fay 认为，在创建复合权重时还存在一个 BRR 的变量，用 
2 — * 还是 ft 乘以初始权重，主要取决于以正交矩阵（ 0<*<1 >为基袖的 PSU 








均值的“折金式”方差的产生如下： 

(1) 删除第一^样本值，然后计算出拟样本均值，即歹⑴ ■ (5+2+1+4)/4 


= 12/4 = 3。接着，换成删除第二个样本值，得到第二个拟均值夕⑵=10/4»以此 
类推，細=13/4, 5»(4) = 14/4, y<5> = 11/4. 

(2) 对这5个拟均值计算它们的均值5= (60/4)/5 = 3,这个 

均值与样本均值相等。 

(3) 然后方差就可以从这5个拟均值(每个都包含4个观察值)的变异性中 
估计出来： 



这个结果与方程 4. 5的结果相同。 

这些基于复合抽样的程序有一个明显的优势*他们可以同时应用于那些无 
法用方福表达出来的估计值，如样本中位数，以及那些以公式为基础的估 计值。 
中位数的抽样方差没有可用的公式，但是“折叠式”程序却可以为其提供一个估 
计值。用上面这个倒子，样本中位数是3,而5个对应的拟中位数分别为3, 
2.5, 3. 5, 3. 5和 2.5( 这些拟中位数的均值为3)。用方程 4. 6,中位数的方差估 
计为 0.8. 

以同样的方式，“折叠式”程序还可以应用于复合抽样。我们可以每次去掉 
其中一个复合样本并计算出相应的拟值来估计“折叠式”方差，虽然在这种情况 
下它并没有任何计算优势。但是它也可以应用于任意由概率抽样构成的随机 
關。比如，为使用“折叠式”程序，一个系统抽样样本可以被分成随机或系统 
的子样本*对其他抽样设计来说，可以按照 Wolt er (1985: 31—33>提出的实际 
规则构成随机组别。基本原理是，随机组别以下述方式产生:每个随机小组都 
具有与母样本相同的抽样设计。这需要实际抽样设计的详细的信息，但这样的 
信息在公开的调査数据中通常是得不到的 * 因此，“折叠式”程序通常用于 PSU 
而不是随机组别。 

对于配对选择设计，复合样本是通过一从一个阶屋中去掉1个 PSU， 然 




构 成的。 补充复合样本的构成方式是一样的，只需要把这个阶层中去掉的和保 
留的 PSU 对换一下，对每个复合样本都估计一个拟值。对于加权后的样本，保 
留下来的 PSU 的抽样权重需要加大以弥补那些被去掉的 PSU 里面的观察值。 
放大后的权重等于保留下来的 PSU 中所有权重的和除以一个因子 （1 一 
twAtO, 其中是被去掉的 PSU 中所有权重的和，而 《•» 是该阶层内所有 
PSU 的权重的和。这个因子代表了被删除的 PSU 占总阶层权重的比例的补 
集®。然后,在配对选择设计中某个样本统计值的方差就可以由阶层 A 中拟值 
U i 和补充拟值 *4 通过下列方程计箅出来： 

t»(S) = S CCttA-«) 2 + («&-«) 2 ]/2 = 2 C«i-« # ) 2 /4 [4.7] 

这个估计值与方程 4. 3的形式一样，可以调整为每个阶层只包含一个复合 
样本 (不与 补充样本结合起来取 均值) ，像 BRR 中方程 4. 4 一样，得出 

V(«) = [4.8] 

JRR 并不局限于配对选择设计，它可用于每个阶层含任意数量 PSU 的情 
况。如果我们用表示第 A 个阶度第 i 个复合样本的1/的估计值，％表示第 A 
个阶层中被抽中的 PSU 的数量，作表示在第 A 个阶层中形成复合样本的数量， 






仔细观察表 4. 4,我们可能会觉得 JRR 复合估计值的变异程度没有表 4. 3 
中 BRR 复合估计值的变异程度那么大。但我们要注意， JRR 代表一种使用了 
不同方法估计方差的不同的策略。注意 BRR 中方程 4. 3的分母包含了复合样 
本的数量》，面 JRR 中方程4 7则与复合样丰的数量无关。原因在于，在 JRR 
中，复合估计值本身已经与复合样本的数量相关。由于那些复合样本的产生过 
程已经删除了其中一个单位，因此与只有少量的抽样单位可用于构造复合样本 
的情况相比，当可供利用的抽样单位数目很大时，得出的复合估计值会更加接 
近于总体估计值。因此，不需要在方程 4. 7和 4. 8中加人复合样本的数量，但 
是，当复合样本的数量比 PSU 的总数量少的时候，就霈要把复合样本的数量考 
虑进来，如方程 4. 9 所示。 

综上所述， JRR 技术以拟复合抽样的方法为基础，可以用于估计复杂抽样 
S 做任何限制,但产生复合样本时要 
苗提到的，这些详细的设 

SS 数据文件可以提供更 

?而且更接近真实抽样设计 

的随机组群，而二 


1样的方法为 a 

I査中的抽样方差。不需要对样本选择方案做任 f 
5 常小心，必须把最初的抽样设计考虑在内。正如前面提到的， 

-信息对二手分析研究者来说很难 得到。 比如，如果 GSS 数据: fi 

:的关 于终编集群的信息，我们就可以构造更加方便而且更接 ifi 

i 群，而不需要把 JRR 技术用于 


I一种方法是由 Efr 0n (1979> 推广 ( 
S1 察到的数据中抽取初级抽样单 { 


t 位 (PSU) 来 

建立具相同规模且与设计中的结构相同的复合样本。把自主抽样法应用到 
GSS 数据中的42个拟阶层中的84个 PSU 中，我们会抽到84个 PSU (使用有放 
回抽样方法)，每两个从同一个阶层中得来。在某些阶层中，相同的 PSU 可能会 
被选择两次 • 这种抽样方法常常要重复多次，最少 200( 标记为 B) 次 (Efron & 
Tibshirani, 1993,第 6 . 4 节)。 但是，如要对更少的变量进行估计，通常就需要 
多非常多的复合样本 (Korn & Graubaid, 1999: 33), 对每个新建立的复合样本 
(«/) 都进行参数估计。然后，所有复合样本估计值的均值，其方差的自主抽样估 








计值表示为： 



我们需要把这个估计值乘以 （《— 1>/«以纠正偏差•当”很小时，偏差可能 
非常大。在我们的例子中，每个阶层内有2个 PSU， 估计到的方差需荽平分。 
另一个纠正偏差的方法是在阶层 A 内重新抽取 （ 取一 1 ) 个 PSU， 然后把这些抽 
中的 PSU 内的观测值的抽样权重乘以呦/(垛一 1) (Efron, 1982, 62-63) •在 
我们的例子中，这样会产生如 BRR 中的半样本复合样本。基于至少200个复合 
样本的自主抽样估计与基于44个半样本复合样本的 BBR 估计差不多相同。由 











泰勒级数法（线性化） 


的应用是用于获取难以封#的函数值的近似值,比如 指数# 或者对数 [ log ( x )] 
函数。它出现在计算机能完成该项特殊功能之前，以及在我们还无法获得相关 
的适用表时。户的泰勒级数扩展涉及到对 P 求关于 X 的一阶导数或者更高阶 
的导数》对某些值一通常是0~估计这些导数;并在这些导数的基硇上建立 
—些列 〈数列 /方程)项 • 浐的扩展为 



下面这个是以 a 扩展的一般方程的 应用： 

/te)= /(a) + /(aKx-a) + 乙 ⑷ + … 

在统计上，泰勒级数法用于获取某些非线性函数的近似值。通常，近似值为 
函数提供了合理的估计，有时候近似值甚至是一^线性函数 6 这种方差估计的方 
法在现有文献中有几种不同的名称，包括线性化方法、 delta 方法 （ Kalton , 
1983, 44) 和方差传递法 ( Kish , 1965.- 583). 

在统计应用中，扩展估计用的是工的均值或者期望值 Eb)。 如果我们用 
£(x) 代替上面薄个一般公式中的幻会有 

/(«>=» /[£(*)] + /TE<*)]Dr — Eix)~] + ,[E(x)][* — J?(：t)] 2 /21 + … 
根据定义， /(x) 的方差 VC/Oc〉] » EC/* Or )] —皮 [/(X)] ，使巧泰勒级数 
扩展法，会有 

VI/Oc)] - {/[E(a：>]} 2 V(：c) + … [4.11] 

对不止一个随机变量的函数，方法也一样。对具两个变量的函数，泰勒级 


数扩展法会产生 






Vt/Oci ， X2>] = (-^-) (-^-)cb»<xi, xz) [4.12] 


把方程 4.12 应用到两个变量 x 和; y 的比一即 r = y/* —之中，我们会 
得到比率估计的方差方程： 



V(的名2 S (普） (-^)cb»te, [4.13] 



把方程 U3 应用到《个观察值样本中的 c 个变量的加权后估计中， 


WoodnrfKl9n) 指出 

’ ■兰 v[U w 2( 彔)种] 






—种线性方差形式具有计算上的优越性，因为它 3 


了方程 4. 13中 c X c 协方差矩阵的対嚷《 —个简单的加法的互换就实现了把多 
阶段估计问題转化成单变量问题的便利。这种通用的计算程序可用于不同的 
非线性估计，包括回归系数 (Fuller， 1975, Tepping, 1968). 

在复杂调査中，这种近似值法被应用到阶层内的 PSU 总体。即,方差估计 
值是同一阶层内不同 PSU 的(方程 4. 14 中〉 方差的加权联合值。这些方程很复 
杂，但需要的计算时间远比上面我们讨论过的复制方法所用的时间少得多•这 
种方法可用于任何一种用数学方式表达的统计量，比如均值或者回归系数，但 
不能用于那些非函数式的统计量，如中位数或者其他百分位数。 


我们现在来看 GSS 例子中样本比例的方差估计。表 4. 5列出了按性别、种 
族和教育程度分析，泰勒级数法应用于同意攻击别人的成年人的百分比时的结 



小，所以子样本中的标准误差比总体中的要大。此外，子样本中的设计效应也 
与总体中的不一样。 


这一章中，我们介绍了几种复杂调査中统计置的方差估计方法(更深入的介 
绍请参考 Rust & Rao, 1996). GSS 和其他调査的例子表明，在大部分复杂调査 
中，设计效应大于1。更多的例子，可以参考 E & Lee，Forthofer 和 Lorimor(1986) 
以及 Eltinge, Parsons 和 Janga997) •第 S 章里的例子也将说明在复杂调査数据 
分析中上述其中一种方法的重要性。 








I 调查数据分析的准备 






中成年人的数量得出的。此外，也很有必要进行亊后分层调轚以使样本构成与 
总体构成一致(如表 3. 1)。如果在与数据提供方联系后仍然无法得到权重，使 
用者也不能假定数据具有自加权性质。如果没有权重就用数据，使用者必须在 
报告结果时明确说明这点，很难想象在没有权重的情况下对调査数据进行分 
析，即便是在基于模型的分析之中，这种情况我们也会意识到可能存在不等选 


] 子样本的不间应答2 
-效应的计算通常需】 


m »在某些特定的嵌人式设计中，还需 
I。如果从每个层内选择一个 PSU (如泊 

-样的。如果没有用到分层或者数据并; 


:率(虽然与基于设计的分析使用方法不 同〉。 
f 要第一阶段选择程序方面的信息，即，层和 PSU 的 
[人式设计中，还需要次级抽样单位和相关的层方面的信 
J 在 GSS 中），层的标识与 PSU 的标识是 


j 进行分析。如果没3 

淀的抽样设计，把数 


1果没有任何阶层与 PSU 信息，那< 

:计，把数据当成 SRS 是否合理。 

矣识可供利用时，我们需要确保每个阶层内至少有2 


•假定其 

: 么就很 


PSU， 否則就不可能估计方差，如果每个阶层内只有一个集群被选中，就需要 
对层进行配对以产生拟阶层。对层进行配对箱要充分理解抽样设计。第3章列 
举了 GSS 中一个特定的阶层配对策略的 例子。 当相关文档中没有任何有用的 


信息时，也可使用随机匹配的方法。基于美国国民健康调査， Stanek 和 Leme- 
show(1977> 研究了匹配的效应，发 现加^ 均值的方差估计和联合比估计对不 


同的阶层匹配方法没有什么反应，但这个结果可能并不是对所有的调査都 


适用。 


预备性分析的重要性 

调査数据分析以前期探索研究为起点，以检验数据是否适合用于有意义的 
分析。对二手数据来源的前期研究中，一个重要的考虑因素是要检验不同的子 

群体中是否存在足够的观察值以支持后面的分析。基于未加权的列表结果，分 

析者可以确定样本规模是否足够大，以及变量的不同类别是否需要合并•未加 












存在测量误差或者录人错误。 

虽然单元无应答调整是由数据收集机构在创建抽样权重时进行处理的，但 
分析者必须自己处理缺失值，即选项无 应答。 如果缺失值较少，我们可以在分 
析中忽略那些具缺失值的受访者。但是，基于设计的调査分析通常不会完全排 
除具缺失值的观察值，这种分析通过把具缺失值的观察值的权重设为0而仍然 
使用完整的数 据库。 这对于估计抽样设计中固有的方差是非常有必要的。无 
论是把观察值完全排除还是把它的权重设为0,点估计的结果都一样，但方差估 
计的结果却不相同。把观察值完全排除会低估 方差。 

如果选项无应答情况比较严重，那么忽略缺失值的做法就会把太多的权重 
设为0,这样原来的加权方案就会遭到破坏从而产生偏差，也就不可能再准确反 
映目标总体。解决这个问通的方法是加大没有缺失值的观察值的权重，以弥补 
那些被忽略掉的观察值。在实施这种调整时，我们通常假定具缺失值的对象内 
部并不存在系统的棋式，但这个假定也可能无效。比如，如果所有具缺失值的 
Xlf 象都是男性或者都属于某个特定的年龄群体，那么简单地加大那些剩下的观 
测值的权重就不合适。另一个可行的权重调整办法是利用某些合理的方法填 









阶层内相邻的 PSU 合并起来》由于合并 PSU, 因此只有一个 PSU 的阶层会与 
相邻的阶层合并起来。但是，合并太多的 PSU 和阶层会破坏原来的抽样设计。 
随之而来的数据分析也可能出现问题值，因为已经不可能再判断 (PSU/ 阶层） 
合并后的样本代表的究竟是哪个总体。每个 PSU 所需要的观察值的数量取决 
于所要进行的分析类型。分析性研究比推述性统计量的估计所需要的观察值 
数量 更大。 普遍的法则是这个数量应该足够大，以对某个估计值计算 PSU 内部 
方差。 

为了说明这点，我们来看看 GSS 数据。按阶层和 PSU 进行的未加权列表 
结果显示， PSU 内部观察值的数量在8至49之间，大部分大于13,这意味着 
PSU 很可能已经足够大，可用以估计均值和百分比的方差。在分析性研究中， 
我们可能需要分析按教育程度和性别分类后同意攻击(别 人〉 的成年人的百分 
比。对于这个分析我们需要检査在特定的分性别教有类别内，是否存在一些没 
有任何观察值的 PSU. .如果对某些分性别教育类别存在许多没有观察值的 
PSU， 这就会使方差一协方差矩阵的估计(这个估计基于阶层内 PSU 总体的变 
异情况)出现问题。按 PSU 得出的分性别 (2 类)教育 (3 类)列表结果显示，84 
个 PSU 中有42个至少有一 t* 分性别教育单元没有观察值。即使把教育程度合 
并成两类，我们也窬要合并几乎一半的 PSU。 因此，我彳 Q 不应就关于攻击这个 
问题同时分析性别和教有这两个变量与攻击问题的关系，但可以在不需要合并 
较多 PSU 和阶层的情况下，单独分析性别或者教育与攻击问題的关系。 

我们不能通过在分析范围内选取观察值的方法进行复杂调査数据的子群 
体分析。虽然个案选择不会改变基本权重，但它可能会破坏基本的抽样设计 s 
比如，选择一个小的种族类别可能会去掉一部分 PSU, 剩下的 PSU 中观察值的 
数量也会显著减少。结果难以从选到的子集中评估基本设计中固有的设计效 
应。即使基本设対*并没有完全被破坏，伹从复杂调査样本中选择观察值也可能 
导致方差的不准确估计，正如上面处理缺失值的方法中所述的一样。准确的方 
差估计需要在分析中保持完整的数据并对在分析范围外的观察值賦予0权重。 
软件包中可用的子总体分析方法，其子群体分析并不对分析范围内的观测值进 
行 选择。 我们将在第6章对子总体分析做进一步介绍 。 




统计方法进行前期检验。但是，由于调査数据中权重的重要作用，任何忽略了 
权重前期分析的检验都不可能达到预期目标，一种把权重考虑在内的前期分 
析方法是选择具可操作规模的子样本，其选择概率与权重大小成比例，以利用 
标识统计图形方法分析这个子样本。第6章第一部分将对这个方法进行介绍。 

方差估计方法的选择 



一 t 简单的方法以更加合理地融人无应答和事后分层调整。通过单独对每个 
复合样本进行加权调整，它可以在方差估计中融人调整的效应。 




























别便于使用 • 如 SAS— 样， SUDAAN 的许可证需要每年更新一次。 

方差估计的默认方法是泰勒级数近似法，也可选择使用 BRR 或 JRR。 它 
几乎可以处理所有类型的抽样设计，包括多层嵌套和事后分层设计。它具有可 
用于复杂调査数据分析的最全面的分析特征，但相比另外两个软件包，它的维护 
需要更多的费用。它支持一系列不同的统计程序，包括 CROSSTAB，DESCRIPT, 
R/mO, REGRESS, LOGISTIC, LOGUNK (对数线性回归）， MULTILOG (多 
类别和次序 logistic 回归）和 SURVIVAL(Co x 比例风险模型）。过去的这些 


模的 GATAN. SAS 使用者可能会觉得这些程序很容易执行，但对初学者来说， 
如果没有有经验的用户帮助，可能难以明确该选用哪种设计，也难以解释输出 
结果. SAS 网站提供了咨询和技术支持， 

State 是包含了调査分析棋板的通用的统计程序包，可从德克萨斯州大学城 
Stata 公司获取。它的调査分析部分支持一系列不同的分析性程序，包括 
svymean, svytotal, svyprop (比例）， svyratio (比率估计 )，svytab (二维表）， 
svyregress (回归）， svylogiUlogistic 回归）， svymlogit (多类别 logistic 回归）， 
syypoisCpoisson 回归) , 8 vyprobit(pro&t 模型）以及其他。它利用 PSU 用泰勒 
级数近似法进行方差估计(最终集群通近法)。虽然它并不支持复杂的设计如 
多层嵌套设计，但可用于分析大部分实用的两査设计。其大部分调査分析程序 
与它的通用(非调査)统计程序类似，这意味着，它的统计分析中的许多普遍特 
征可轻易与调査分析部分结合 起来。 它的输出结果也相对比较容易理解，因此 
新手可能会觉得 Stata 比 SUDAAN 更容易学。 




















创建复合权重 


BRR 方法箱要复合权重。这些权重可能包含在数据库中或者在运行分析 
之前创建。通常需要创建 H(4 的倍数，大于阶层的数量)组复合权重。对于 
SUDAAN 来说，复合权重输入在数据之中， WesVar 可以用适当的设置创建复 








人的数据包括层， PSU, 病床的数量，艾滋病人的数量，抽样权重和8组复合权 
重 (wl 到 w8)。 注意复合权重要么等于样本权重的2倍(如果这个单元被选 
中），要么等于 0( 如果这个单元没有被选中） • 这些0或2倍的权重根据6行8 
X8 的正交矩阵进行排列，与表4,2类似。艾滋病人总体的比率估计(再次参考 
注释2>等于目标区域内文滋病(床位)与床位总数 (2501) 的比， PROC RATIO 
和 DESIGN = brr 指定说明所要的统计量和估计方差的方法， deff 要求得出设 
计 效应。 因为使用的是 BRR 设计，所以不需要 NEST 这个命令(指定说明阶层 
和 PSU) • REPWGT 指定复合权重变量 • NUMER 和 DENOM 指定说明比率 
估计的分子和分母•由 SUDAAN 而得的 BRR 估计值见表 5. 1左下部分。估 
计值等于1191，其标准误差为 154* 2( 设计效应为 2. 10)。同样的数据, WesVar 
基于同一正交矩阵不同的行来创建复合权重，其得出的点估计是一样的，而标 
准误差为 155. 0„使用不同的复合权重(抽样权重的1或0倍)的 H5R 得出的 
标准误差为 149. 5, Fay 的 BRR 变体使用的复合权重根据某个观察值是否在 
被选中的单元内而等于抽样权重的2—灸或者 A 倍 (0<A< 1>。当 * = 0. 3时， 
标准误差估计为 137. 3。 

Jackknife 程序并不需要复合权重。这个程序通过在每个复合样本中删除1 
个 PSU 来创建复合样本。 JRR 的 SUDAAN 命令和结果见表 5. 1的右部分。 
由 Jackknife 程序估计到的标准误差为 141. 3,比 BRR 估计的结 果小。 由泰勒 
级数近似法(假定为有放回抽样〉得到的标准误差为 137. 6,比 Jackknife 估计值 
稍撖小点，而与 Fay 的 BRR 估计结果类似。如第4章所述， BRR 和 JRR 假定 
有放回 抽样。 如果我们假定无放回抽样(使用有限总体校正法)，这个例子中的 
标准误差估计值为 97. 3。 

美国国家卫生统计中心 (NCHS) 的第三次国民健康与营养谰査 (NHANES 
III)W 包含了 BRR 的复合权重。这些复合权重是为 Fay 的方法而创建的， A = 
0.3,且級人抽样不同阶段的无应答和事后分层调整。如 Kom 和 Gnmbard 
(1999) 提出的，使用 Fay 的把无应答和事后分层调整融人在内的创建复合权重 
的办法更可取9但许多调查数据库通常没有这种权重，也缺少适当的创建这种 
*合权重的倌息。 



寻找合适的调查数据分析的模型 


据说许多统计分析是在没有确 it 清楚的目标的基础上开 展的。 在分析数 
据之前，好好考虑研究问埋并建立一个明确的分析计划是很重 要的。 如前面章 
节所述，在调査分析中对数据进行前期分析和探索是非常重要的。相比基于设 
计的分析，这个任务在基于模型的分析中要困难得 


个合适的模型所需要的信息。调査分析者通常没有参与数据收集，要理解数据 
收集的设计通常很困难。对最初的设计进行提问可能并不充分，但却很有必要 
弄淸楚设计方案如何在实地调査中执行。通常，相关的设计信息既无法在相关 
文档内找到也无法从数据库中得到。再者，给定可能的样本规棋，某些调查设 
定的目标可能也太过不切实际 • 所谓的通用调査不可能包括后来使用者关心 
的所有问题。要建立一个包含所有相关变量的合适的模型#—个挑战。 

此外还应该检査巳有知识，尤其当类似的数据曾在以被分析过时。最好 
不要从头开始拟合模型，相反可以检査一下新的数据是否与先前的(研究)结果 
一致。 遗憾的是，在社会科学和健康科学研究中很难找到使用复制调査数据的 
基于模型的分析。许多处理基于模型分析的文章关注的是在理想化的条件下 
分析调査数据的最优程序。比如，大部分公共调査数据库只包含阶层和 PSU, 
多层或者分层线性模型 （Bryk & Raudenbash, 1992» Goldstein & Silver, 
1989; Kom&. Graubard, 2003) 界定额外目标参数的机会有限。复杂调査数据 
分析的混合线性模型的使用需要进一步的研究，我们希望它能促使调査设计者 
把设计和分析更紧密地结合起来。 





第 6 章 I 调查数据分析的操作 


这一章会对调査数据分析做各种说明，重点介绍融入权重和数据结构对分 

析的影响。我们首先介绍一种对大型复杂调査进行前期分析的策略。我们利 

用 NHANESIU 阶段II的数据对各种不同的分析加以说明，包括描述性分析、 
线性回归分析、列联表分析和 logistic 回归分析。对每种分析，我们都将讨论调 
査数据要求的一些理论上或实际上的考虑因素。分析中所使用的变置的选择 
是基于阐释方法的需要，并不是为了说明实质性的发现。最后,我们还将就基 
于模型的视角进行讨论，因为它与本章列举的分析性例子相关。 


预备性分析的策略 

抽样权重可能会在复杂调査数据的前期分析中造成破坏，但在数据探索的 
过程中忽略权重并不是令人满意的解决办法。另一方面，用于调査数据分析的 
程序并不适用于基本的数据探索。而且图解法并不是专门与复杂调査一起设 
计出来的。在这一部分，我们会介绍一种把权重考虑在内的前期分析策略。 

在发明计算机之前，权重的处理在数据分析中有各种不间的方法。当 IBM 
分类机器用于数据列表时，常用的做法是复制数据卡片以匹配权重值从而获取 
合理的估计值。为了加快大型调査的制表速度，某些调査采用了 PPS 方法 
(Murthy &• Sethi, 1965)。意识到分析复杂调査数据的困难性, Hinkins, Oh 和 
Sch eur en(1994) 提倡使用逆抽样设计演算法，这种方法可从现有的复杂调査数 
据中产生一个简单随机子样本，用户因此可以直接把传统的统计方法应用到这 
个子样本中。这些方法对调査数据分析已经不再有吸引力了，因为现在巳经有 












示图等图形方法探索数据。其真正的优势在于重新抽样过的数据近似地代表 
了总体，可以在忽略权重的情况下进行分析。从这种重新抽样过的数据中得到 
的点估计几乎与完整数据库中的加权后估计值相等。从这种重新抽样过的数 
据中发现的有趣的趋势很可能会被更完整的(通过 Stata 或者 SUDAAN 进行 
的)分析所证实，虽然标准误差可能会有所不同。 

描述性分析 

我们使用 NHANES III阶段II中的成人样本 (17 岁或以上)进行推述性分 
析。 这个样本包含9920个观察值，这些观察值处于23个拟阶层中，每个阶盾含 
2个拟初级抽样单位。拟阶层和初级抽样单位的标识包括在我们的工作数据文 
件之中。数据文件中扩展权重被转化为相对权重。为了检査在不同的 PSU 内 





杂统计方法的使用很吸引人， 
例 (Kalton & Kasprszky, 19 


生缺失值的机制(是否可以 忽略〉 以及缺失值的模式(单调的还是一般的)。复 
及引人，但却可能弊大 于利。 更好的方法是根据具体的实 
y，1986i Korn & Graubard, 1999第 4. 7节和第9章)， 
而不是技术性的搡作指引来选择合适的方法。关于这方面详细的讨论不在本 
章讨论之列。以下简单的介绍仅供解说之用。 

在我们的数据中，年龄和种族没有缺失值。我们先填补那些缺失值最少的 
变量值。维他命使用情况和抽烟状况的缺失值少于 10 个，教育和髙度的缺失值 
大约为1%*我们使用热卡填补[ 5 ](就近填补)的方法对这4个变置填补缺失 
值——按性别在5年一组的年龄类别内以与样本权重成比例的概率随机选取捐 
赠观察值。当某个55^值内还有更多的变量具缺失值时，我们也使用相同的观 
察值对缺失值进行填补。我们使用回归填补法来填补高度 (3. 7%缺失*基于权 
重、年龄、性别和种族则 2. 8% 缺失; 基于年龄、性别和种族则 0. 9% 缺失〉 、收缩 
压 (2. 5%缺失，基于离度、权重、年龄、性别和种族)、贫困指数(10%缺失,基于家 
庭规模、教育和种族)等的缺失值。填补的贫困指数值约 0. 5%为负值，这些值 
被设成 0. 001 ( 数据中最小的贫困指数值) • 附带说明一下，我们可以把其他人 
体测量的方法放到回归填补法之中，但我们的演示仅基于这个分析所选择的变 
量。最后，体重指数值 (5. 5%缺失)以更新后的权重和高度信息为基础重新计 
算而得。 

为了说明抽样权重和设计效应会导致不同的结果，我们采用三种不同的方 
法进行分析:⑴未加权的，忽略数据结构 “2) 加权后的，忽略数据结构》(3)调査 
分析，结合权重和抽样特征。第一种方法假定简单随机抽样，第二种考虑了权 
重伹忽略了设计效应，第三种则为给定的抽样设计提供合适的 分析。 

首先,我们在填补和未填补缺失值这两种情况下，检验了加权后均值和比例 
以及它们的标准误差。填补的结果对点估计并没什么重大影响，用第三种分析法 
估计到的标准误差稍微变小了一点。没有填补缺失值时，加权后的贫困指数均值 




别，街啦 e# 变量来说，: 
例小祕以_ 

两个少数种 j 


句值估计值、二分类变量的百分比和 
l 个变量其加权后和未加权的均值/ "s ■分比之间存在细微差 
说，这种差别非 常大。 加权后黑人的比例比未加权时的比 
义上，加权后西班牙裔的比例比未加权时的小将近肋％,反映了对这 
>族的过抽样。加权后的平均年龄约比未加权的平均年龄小 3. 5岁， 


原因在于对年老者进行了过抽样。另一方面，对贫困指数和受教育年限来说， 
加权后的均值比未加权的均值大很多，意味着被过抽样的少数种族集中于收人 
»• 加权后的维他命使用情况的估计值也在某种程度上比 
【可能 反映了少数种族较少使用维他命。 

司时反映了权重和设计特征的)调査估计值^ 

格顶部加权后的结果完全相同，但对所有的$ 

了。 这种差别反映在表格呼 
【后统计值的标准误差之比运 

年龄的巨大的设计效应部分反映了这些特征的居住同质性。这两/ 

特征变暈(贫困指数和教育)和年龄的设计效应比黑人和西班牙裔5 


虽然估计 


和教育分布中的底端 。加 
未加权时大一些。这可能 i 

表格底部显示了 (同时反映了； t 
到的均值和百分比与表格顶I 
其标准误差都显著增大了。这种差别反映在表格中的设计效应中(表格底部标 
准误差与表格顶部加权后统计值的标准误差之比的平方〉。贫困指数、教育和 
备的巨大的设计效应部分反映了这些特征的居住同质性。这两个社会经济 
赃变暈(贫困指数和 教育〉 和年龄的设计效应比黑人和西班牙裔这两个变童 
的设计效应要大。而 1976—1980 年的 NHANESII 中的结果却相反(数据用于 













在表 6. 3中，我们演示了进行子群体分析的例子，正如前一章所提到的，任 
何使用复杂调査数据进行的子群体分析都应该使用完整的数据库，而不能在分 
析范围内任意选取数据。在 Stata 中有两种合适的子群体分析的方法:使用 by 
或者 SU l>pop。 表 6. 3显示了对黑人这个变量进行子群体分析的例子。在表格 
顶部,我们用 by 对非黑人和黑人分别估计了 BMI 均值。黑人的 BMI 均值比非 
黑人的大，虽然在非黑人中 BMI 的设计效应 (5. 5) 与总体的设计效应(表 6. 2 


有 L1. 


=群体之均值是? 
于当 black = 1 : 


讀 fc 的线性组合。两个子群体^ 
am 命令进行检验(如 [bmi]l-[bmi]0, 检验关于当汕 
0 0)时各自的总体 BMI 均值之间的差别的假设)，基于 r <5 
差异在统计上是显著的。 

设计效应是 1. 46,表示这个检验的 f 值降低了约20%以抵消抽样设计 
特征。 


:否相等可以用 
和当 black = 
i 个均值之间的 


另一种方法， subpop 可月 
方法使用了完整的数据库，把 


op 可用于估计黑人的 BMI 均值，如表格底部所示。这种 
f 范围内的观察值的权重设为0。均值、标 
准误差和设计效应与表格顶部用 by 命令得到的黑人的结果相同。 

下面,我们通过明确(分析)范围 (if black = 1) 把黑人选择出来，从而估计 
BMI 均值。因为在某些 PSU 中并没有黑人，所以这个方法并不奏效。按阶层 
和 PSU 的列表显示，在第13个和第15个阶层内只有1个 PSU。 当这两个阶层 
与邻近的阶层合并起来时， Stata 分析产生了结果„虽然点估计与前面的相同， 
但标准误差和设计效应却不同。普遍的法则是，调査数据的子群体分析应该避 
免筛选出子数据库，这与 SRS 数据的分析 不同。 

除了 svymean 命令外， Stata 还支持以下几种描述性分析: svytotaK 用于总 






估计方法可能(在某些情况下)不合适 • 我们在此 

. 研究，而只重点关注一种可用于最广泛的情况之 

中的、有现成软件可供利用且已被广泛应用的方法。这种棋型参数估计方法是 



设计加权最小二乘法， SUDAAN、Stata 和其他复杂调査数据分析软件都支持 
这种方法的使用。 


DWLS 方法中的权重是第3章所讨论的抽样 权重。 DWLS 与不等方差的 
加权最小二乘法稍微不同，它是从偎定的协方差结构中得到权重的(见 Lohr， 
1999,第12聿)。考虑到由抽样设计和其他对权重的调整所带来的复杂性，第4 
章所讨论的其中一种方法可用于在模型参数估计值的方 差一协 方差矩阵估计 
中。由于这些模型使用的是 PSU 总体而不是个体值作为方差计算的細，因此 
这个设计的自由度等于 PSU 的数量减去阶层的数纛而不是样本规棋。与误差 
平方和相关的自由度则等于 PSU 的数童减去阶层的数量再减去模型中公式项 
的数量。 

表 6. 4显示了用前面提到的三种分析方法对 BMI 进行多元回归分析的结 
果。自变量与前面的描述性分析所使用的相同。此外,我们还包括了年龄平 
方，以控制可能存在的年龄对 BMI 的非线性效应。简单起见，这个例子中没有 
包含交互项，因为包含交互项除了会加深多重共线性问题外，还会增加及 2 。我 














了某些集群对集群的变异性，那么就可能在回归分析中得到更小的设计效应。 
比如，如果处于相同集群中的人具有类似 BMI 的部分原因是因为他们具有类似 
的年龄和教育程度，那么在回归模型中按年龄和教育程度进行调整躭可能解释 
掉一部分集群对集群的变异性。这样集群效应对模型的残差的影响就可能 
更小。 

囬归分析也可以用 SUDAAN 的 REGRESS 程序执行，过程如下： 


；DESlGN = wr ； 








列联表分析 

分析两个离散变量间相关性的最简单的方法是二维表格。如果数据来自 
SRS， 我们可以用 Pearson 卡方统计值检验关于独立的零假设。对基于复杂调 
査数据的二维列表分析，需要对这个检验方法进行修改以考虑调査设计的影 
响 9 已有多种不同的检验统计值被提出来。 Koch,Free_*F r eeman(1975) 
提议使用 Wald 统计值 M ，且巳被广纥使用 a Wald 统计值通常被转化成 F 统 

计值以决定/>值。在 F 统计值中，分子中的自由度与表格的维度联系在一起， 

分母中的自由度反映的是调査设计。巵牵， Rao 和 Scott(1984> 提出了对数似然 

统计值的修正方法，使用具非整数自由度的 F 统 计值。 基于一个模拟研究 
(Sribney, 1998)， Steta 把 Rao~Scott 修正统计值设为默认程序，但 Wald 卡方 
和对数线性 Wald 统计值也是可用的选项 4 另一方面， SUDAAN 在它的 
CROSSTAB 程序中用 Wald 统计值。在多数情况下，这些统计值得到的结论是 
相同的。 

表 6. 5列出了用 Stata 进行的二维列表分析情况。这个分析列出了维他命 
使用与编码为3个类别的教育年限(1=少于12年，2=12年,3=多于12年)之 
间的相关 情况。 在 (A) 部分.，普通的卡方分析忽略了权重和数据结构的彩响。 
教育与维他命使用之间在统计上存在着显著相关，教育程度越高的人越倾向于 
使用维他命。维他命使用者的百分比处于32%(在最低的教育水平中)到 49% 
(在最高的教育水 平中〉 之间。 （B> 部分列出了用相同的数据但把调査设计考虑 
进来时的分析结果。按教育程度划分》加权后维他命使用者的比例其变化情况 
比未加权时稍微大了一点，处于33%(第1级教育程度)到52% (第3级教育程 
度)之间。注意当使用了 ci 命令时， Stata 会对单元百分比计算置信区间》 












这个分析要求同时报吿 Pearson 和 Wald 卡方统计值 • 基于加权后頻数的 
未经修正的 Pearson 卡方比 (A) 中的卡方值稍微大点，反映出加权后百分比的 
变化情况要大些。但是，基于未经修正的 Pearson 卡方统计值，我们无法估计出 
能反映复杂设计的合适的 夕值。 合适的夕值可以从基于设计的自由度为 1. 63 
和 37. 46的 F 统计值 30. 28中评估出来，它以由 Rao-Scott 修正产生的检验程 
序为基础。未经调整的 Wald 卡方检验统计值为 51. 99,伹 p 值的产生必须以调 
整后的 F 统计值为基础。两个 F 统计值中的分母自由度都反映了抽样设计中 
PSU 和阶层的数量。调整后的 F 统计值只比 RaaSoott 的 F 统计值稍微小了 
一点。这些检验统计值中的任意一种都会得出相同的结论。 

在 (C) 部分，我们对西班牙裔人口进行了子群体分析。在这个分析中我们 
使用了完整的数据文件。分析基于2593个观察值，但当考虑了抽样权重之后， 
只代表539个人。西班牙裔中维他命使用者的比例(31%)显著低于总体人口中 
维他命使用者的比例(43%>。正如调整后的 F 统计值所示，西班牙裔人口中， 
教育与维他命使用之间在统计上仍然存在显著相关。 

现在我们来看看三维列表。利用 NHANESUI 阶段II中的成人样本数据， 
我们检验按教育程度划分的维他命使用的性别差异情况。这是 一^2X2X3 的 
表格，我们可以在每个教育程度中都进行一个二维列表分析 a 表 6. 6列出了用 
SAS 和 SUDAAN 进行的3个 2X 2列表分析结果，表格顶部显示的是忽略了 
调査设计的分析结果。在最低的教育水平中，男性维他命使用者的百分比比女 
性的低，卡方统计值显示这个差别在统计上是显著的。另一个检验 2X2 列表中 
的相关性的方法是计算比 数比。 

在这个表格中，男性维他命使用情况的比数为 0.2634/(1-0.2634) = 
0. 358,女性的则为 0.3617/(1-0.3617) = 0. 567。男性比数与女性比数的比为 
0.358/0.567 = 0.63, 意味着男性使用维他命的比数是女性使用维他命比数的 
63%。95%的置倌区间内不包含1，表示这种差别在统计上是显著的。在三个 
不同程度的教育水平间，比数比结果是一致的。由于这些比数比是一致的，因 
此我们可以把这三个不同教育程度的 2X2 列表合起来。然后就可计算 Coch- 
ran-Mantel-HaenszeKCMH) 卡方 W/ = 1) 和 CMH 普通比。按教育调整后的 




程序进行相同分析的结果。在 PROC 命令句式中,1 
抽样，表示并没有使用有限总体校正。 NEST 命< 
WEIGHT 命令给出了权重变量。 SUBGROUP 命名 


DESIGN = wr 指定有放回 
•令指定阶层和 PSU 变量， 


维他命使用的加权后百分比与未加权百分比稍微 不同。 在表格_ 

三个不同的分析中，除了在中间那个教育水平之外， Wald 卡方值比 

方值小。虽然在更低的教育水平中比数比几乎保持不变，但在中间 J 

育水平中却降低了 • SUDAAN 中的 CROSSTAB 程序没有计算普通I 
可从 logistic 回归分析中得到，这将在下文中讨论 • 

Logistic 回归分析 


供上半部的 

Pearson 卡 

I及更高的教 

通比数比，但 


前面讲到的线性回归分析对很多社会科学家来说可能用处不大，因为在社 
会科学研究中很多变量通常都用类别(名义的或者次序的)进行测量》有一系 
列用于分析分类数据的统计方法，从前一节所提到的基本的跨列表分析到具各 
种不同联结函数的广义线性模型等等。正如 Knoke 和 Biark e (1980) 所观察封 

5：研究中改革了列联表分析方法，废除了大部分用于 

:间的关系的旧方法。有两种方法被社会科学家广 


1用于分析分类数据的I 
卜不同联结函数的广义名 

的，建模的方法在社会科学研究中 

研究离散类别测量的变貴之间的3 


醜用:1 


顧最大似然方法的对数线性模型 (Knoke &■ Burke, 1980 
a 加权后最小二乘法 (Forthofer 7 Lehnen, 1981» Grizzled, 
Koch, 1969)。 这两种用于分析复杂调査数据的方法在本书的第一 
述，在这些模型中，单元比例或者它们的函数(如对数线性模型中 f 
用列联表中的(各种因素的： 

表，因此在分析中无8 


f 中无法包含连续的自变量。 


在过去的十年间，社会科学家巳经开 ® 
因为它可以把更多的解释性变量涵盏进3 
Nelson, 1984 ( DeMaris, 1992； Hosmer 



数据分析的(统计；>软件包里了。调査分析者可以从一系列模型中选择最合适 










的模型。用 Stata 和 SUDAAN，logit 模型的应用阐释如下。 

方程 6. 1代表普通线性回归分析，检验的是一个连续因变童与一个或多个 
自变量之间的关系。 Logistic 回归是一种用于检验一个类别因变量与一系列自 
变量之间关系的方法。下面这个方程表示对一个二分类结果变量 y 建立模型 
的方式， f = 1，2,…， 

logDri / l—ml = Pa+fiixu +fiixzi + ― + fy - ixp-u < [6.2] 

在方程 6. 2 中，取 是; yi = 1 的概率。这是一个具对数比或 logit 联结函数的 
广义线性棋型。这里用最大似然的方法 (EHason, 1993) 来估计参数，而不是最 
小二乘估计法。因为这里要解的联立方程对参数并不是线性的,所以使用的是 
迭代技术。最大似然理论同时还可估计这些参数(矽的估计值的协方差矩阵，前 
提是个体观察值是随机且相互独 立的。 

正如方差模型的分析一样，如果一个变量有/个类别，那么我们在模型中只 
用 Z — 1个类别。我们将从被忽略类别(或者参照组)的效应中测童这1个类 
别的效应 9 的估计值（》)是模型中对应类别与被忽略类别之间的 logit 的差 
别，即模型中对应类别与被忽略类别的比数比的自然对数。因此， j 就等于对 
模型中的其他变量进行调整后得到的比数比„ Logistic 回归结果通常以比数比 
的方式总结和解释 (Liao, 1994,第3 聿〉， 

在复杂调査数据中，需要对最大似然估计进行调整，因为每个观察值都有 
一个抽样权重。结合了权重的最大似然解通常被称为 pseudo 或者加权后最大 
似然估计 (Chambless &■ Boyle, 1985； Roberts, Rao & Kumar, 1987). 虽然点 
估计是用 pseudo 似然方法计算的，但》的协方差矩阵却是用第4聿讨论的其 
中一种方法估计的。正如前面提到的,与这个协方差矩阵相关的自由度大约等 
于 PSU 的数量减去阶层的数量。因此，标准的模型拟合的似然比检验不能用于 





















准的 logistic 回归分析，忽略了权重和设计特征。结果列于表格 A 部分。在 
logit 命令之前加上 xi 并在相应的变量名前面加上 i, , Stata 会自动对离散变暈 
执行效果或二分类编码。 


表中的输出结果列出了每个离散变量被忽略的类别。在这个例子中，“男 
性”这个类别，在棋型中它的效应是从参照组“女性”的效应中测量出来的。 
至于教育程度，低于高中毕业是参照类别。似然比卡方值等于 325. 63( 自由 
度 d/ = 3>， p 值为 <0. 00001，我们否定性别与教育程度这两种因素一起对 
维他命使用没有影响这个假设，表示存在着显著影响。但 pseudoR 2 表示维 
他命使用的大部分变异情况不能被这两个变量所解释。性别和教育的参数估 
计值、它们的标准误差估计值以及相应的检验统计值也列于表中，所有的因 
素都显著。 

在模型命令中加人 oi ■会得到比数比，而不是芦系数。估计到的男性的比数 
为 0. 64,表示在对教育进行了调整之后，男性在使用维他命方面的比数①是女 
性比数的64%。这个比数比与表 6.6 中的 CMH 普通比数比相同。比数比的 
显著性可以用之检验或者置信区间进行检验。教育程度的第三个类别的比数比 
表示，具大学教育程度的人其使用维他命的可能性是那些具相同性别但教育年 


表 6. 7的 B 部分列出了拟合优度统计值 （ 自由度 d/ = 2的卡方值) • />值 
很大表示主效应模型适合数据情况(与饱和模型没有显著差别)。 



表 6. 7的 C 部分显示了把调査设计考虑在内时，对相同数据进行 logistic 回归 
分析的结果。对数似然值没有列出来，原因在于使用的是 pseudo 似然法。这里我 
们用的是 F 统计值而不是似然比统计值。同样，值表示主效应棋型是对零模型 


①即:使用的概率/不使用的概串.一译者注 







从 <0. 0001上升到 0. 008,原因在于我们把设计(因素)也考虑在内了。 

在运行了 logistic 回归之后, D 部分显示了对参数线性组合的效应进行检验 
的结果。我们想要检验男性的参数与第三个教胄水平的参数之和等于0这个假 
设。由于没有交互效应，因此得到的 1. 3这个比数比可以解释为，具大学教育的 
男性其使用雄他命的比数相对于参照组（少于12年教眘的女性）的比数高 
30%. SUDAAN 也用于执行 logistic 回妇分析，在单机版中使用 LOGISTIC 程 
序或者在 SAS 的可姨版本(不同的用以与 SAS 中的标准 logistic 程序区分开来 
的名字)中使用 RL0GIST 程序。 


最后， logistic 回归模型还可对综合估 
査是为估计全国性的统计值而设计的，因 ： 

估计。得到小地区估计值的一种方法就是利用全国性的健康调査和地区性的 
人口信息进行综合估计。 LaVange, Ufata, Koch 和 Shah(1996> 利用一个拟合 
:回归模型 

I■县老人活动受限的普遍情况进行估计。由于 NHIS 以复杂调査 
设计为基础，他们用 SUDAAN 对 NHIS 的活动受限预测因素以及 ARF 中的县 


了 NHIS (美国国家1 
对美国各州各县老 J 


S。 由于大部分健康调 
、区域进行健康特征的 
健康调査和地I 
h(1996> 利用一 
5) 的 logistic 回！ 

于 NHIS 以复 j 


级变量进行拟合，建立了 logistic 回归棋型，然后，以模型为基础的概率估计值 


被用于计算小地区的活动受限估计值。 






SUDAAN， 这种建模方法可用于复杂调査数据。在这一部分，我们举了两个这 
种分析的例子，但没有对它们进行深入讨论和分析》关于这种方法的详细描述 
及分析请见 Liao(1994). 

为阐释次序 logistic 回归模型，我们检验了基于 BMI 的肥胖类别。公共卫 
生营养学家们用下面的标准把 BMI 分成几种肥胖程度:极度肥胖 (BMI > 30) ， 
超重 (25 < BMI < 30) ，正常 （18. 5 < BMI < 25) ,偏瘦 (BMI < 18* 5>。基于 
NHANESm 阶段II的数据,18%的美国成年人为极度肥胖,34%趙重，45%正 
常,3%偏瘦。我们想要检验这4种肥胖程度 (bmi2 : l= 极度肥胖，2=超重，3= 
正常，4=偏瘦)与一系列解释变量包括年龄(连续变量)、教育、黑人和西班牙裔 
等之间的关系。 

对于这4个肥胖的有序类别，我们对以下3组概率建模使之成为解释变量 
的 函数： 

Pr{ 极度肥胖}相对于 PH 其他所有类别 } 

- Pr{ 极度肥胖+超重 } 相对于正常+傭瘐 } 

卩以极度肥胖+超重+正常 } 相对于 Pr{««} 


然后3个二分类 logistic 回归模型可分别用于上述每一组比较。伹是，鉴于 
这个肥胖类别的自然排序，我们可以在成比例发生比假设的基础上，同时考虑 
这3个二分类模型来估计解释变量的“平均”效应。这里假设的是，每个不同结 



表6.8显示了以上用8^_进行的分析结果。 SUDAAN 命令列于表格 


顶部。 第一 t# 令 PR0CMULITL0G 明确了所用的程序。 DESIGN, NEST 和 
WEIGHT 的具体说明与表 6. 6的一样。 REFLEVEL 说明教育的第一个类别 
作为参照组(如果不明确指出则变量的最后一个类别作为参照组〉。 

















分类变量列在 SUBGROUP 命令之后，这些变量每个所包含类别的数量列 
在 LEVELS 命令之后 # MODEL 这一行命令列出了因变量，随后是一系列自变 
量。 MODEL 命令中的关键词 CUMLOGIT 指明用的是成比例发生比模型。若 
没有这个关键词， SUDAAN 将会拟合多类别 logistic 回归棋型，这个模型会在下 
文进行 讨论。 最后， SETENV 命令要求在发表结果时报吿5个小 数点. 

输出结果显示了三个截距项和自变量的一组系数估计结果。第二个表框 
中的结果表明所有主效应都显著》第三个表框中的比率比可以用与二分类 
logistic 回归中相同的方式进行解释。在控制了其他自变量之后，西班牙裔比非 
西班牙裔具有 1. 7倍甚至更高的厲于极度肥胖的比率。在解释这些结果之前， 
我们必须检査是否满足了成比例发生比假设，伹是输出结果并没有给出任何检 
验这个假设的统计值。为检验这个偃设，我们运行了三个普通 logistic 回归分 
析(极度肥胖相对所有其他，极度肥胖+超重相对正常+偏瘦，极度肥胖+超重 
+正常相对偏痍）。年龄对应的三个比率比分别为 1. 005, 1. 012和 1. 002,它们 
与表 6. 8底部所显示的 1. 015很接近。其他自变量对应的比率比也相当类似。 
我们认为成比例发生比假设看来可以接受。 

利用 svydog 程序， Stata 还可用于拟合成比例发生比模型，但它所拟合的 

模型稍微有所不同。在方程 6. 3中，一组乐 ci 项加在截距项之后，但在 Stata 棋 

型中它被去 掉了。 因此，从 Stata 中估计到的卢系数其符号与从 SUDAAN 中得 

到的相反，而绝对值则 相同。 这意味着从 Stata 中得到的比数比是从 SUDAAN 
中得到的比数比的倒数》这两种方法给出的截距项估计值是完全相同的。 
Stata 用的术语是 cut 而不是 intercept. 

对名义的结果类别，可以使用多类别 logistic 回归模型。用这个模型，我们 
可以检验•多类别名义结果变量(没有顺序的)与一组解释变量之间的关系。 
这个模型指定结果变量中的某一个类别为基准类别，并估计相对于这个基准变 
























査很少提供纵向数据。利用 SUDAAN、Stata 和其他软件支持的巷 
不同的联结函数定义的广义线性模型也可应用到复杂调査数据中。 


整个 美国。 这些 PSU 有时包括為 
是行政单位，而谰査并不是为了 51 


基于设计和基于模型的分析 

到目前为止，所有的分析都依赖于基于设计的方法，因为分析* 
样权重和设计特征。在把这些分析与基于模型的方法联系起来之苗 
单看看用于这些分析的调査数据。 NHANESffl- 
j* 包括单个县，有时包括2 
b 为了对这些单位分别进行估计而设 
位中，81个 PSU 被选中，选择概率与 PSU 的规模成 

阶层. 此外，从根据人 a 统 ih# 特征而非地理位置形… -- 

2个 PSl^ 同样地，阶层并不是以定义人口参数为目的 
个阶段涉及地区图块，包括城市或者城郊街区或者其他 

更多的少数种族人口的图块用更髙的概率进行选取。 

把抽中的地区图块里面的所有家庭罗列出来，然后按 M 以图： 

率对它们进行抽样。抽样的第四个阶段是对抽中的家庭里 i 

以进行访问 4 这些次级单位用以辅助抽样而不是用于界定. 

数据档案只包括阶层和 PSU， 支持次级抽样单位的标识并不 
重的计箅基于被访问个人的选择概率，此外还包括对无应答： 

调整6前几章所讨论的许多分析问题是由大型社会和健康 i 
成的。现有的数据无法支持分层线性模型以融合多阶段选择 
由于受访个体的不等选择概率加上无应答和事后分 g 调 
m 数据的描述性分析中 忽格抽 样权重，就会难以令人信服 • 

行加权的原因已经很清楚。正如表 6. 2显示的，在未加权估计中4 
相关的变量的偏差很大。对所有的变量，加权后估计值的标准误！ 
的结果很类似，这意味着抽样权重的变异情况并不会增加方差 
PSU 和阶层考虑进来时，加权后估计值的标准误差相当大，正如 i 







映的。降低方差的一种方法是使用包含辅助信息的模型。典型的例子是熟悉 
比率和回归估计 (Cochren， 1977,第6章)。在这些估计中，辅助信息采取的形 
式是已知的与目标变量相关的伴随变量的人口均值，辅助信息的使用可以扩 
展为分布函数的估计 (Rfto, Kovar& Mantel, 1990) ，但辅助信息在例行描述性 
分析中的使用是有限的，因为很难找到合适的辅助信息。 

回归分析中模型的使用是显而易见的。表 6. 4中的未加权估计严格地以基 
于模型的方法为基础。它忽略了抽样权重和设计特征，但许多相关的设计信息 
已经包含在自变置之中：比如年龄(对年老者的过抽样）以及黑人和西班牙裔 
(对少数人口的过抽样)。其实，基于模型的系数估计值与加权后估计值类似， 
意味着基于模型的分析在这个情况下很合理》—个显著的例外是教育的系数， 
它在两种估计方法间非常不同。在基于模型的分析中教育非常不显著,但在加 
权后分析中却非常显著。教育的效应无法被基于模型的分析检瀾到，因为对年 
长者而言，教育的作用在逐渐消失。虽然年龄已包含在模型中，但年龄和教育 
的交互作用却没有包含在模型中。这个例子说明，抽样权重的使用避免了模型 
的错误设定。 

Korn 和 Gra U bard(1995b> 利用1988年美国全国母婴健康调査数据，更进 
—步地阐释了在回归分析中使用抽样权重的好处。这个调査对低出生体重的 
婴儿进行了过抽样。估计到的胎龄对出生体重彩响的回归线在未加权分析和 
加权后分析间非常不同。虽然未加权拟合均等反映了样本观察值且不对总体 
进行描述，但加权拟合把回归线拉到了估计到的总体所处的位置。这两个变量 

之间的关系其实是曲线的。相反，如果我们使用二次回归，那么未加权和加权 

后回归就会更具一致性。 

正如上面对表 6. 4的分析结果所进行的讨论,对加权后和未加权回归间的 
差别进行细致的检验有时可以找到应该加人到方程中的重要变量或者交互项。 
未加权和加权后估计之间的差异表明，把抽样设计考虑在内可以避免可能出现 
的总体模型的错误设定。已有文献已经提出了几种用于检验加权后和未加权 
估计之间差异的统计值 (DuMouchel Duncan， 1983； Fuller， 1984； Nord- 
berg，1989)* Korn 和 Graub ar d(1995 a ) 利用基于设计的变异性把这些检验统 







计值应用到 NHANES I和II的数据中。他们建议当低效性很小时，使用基于 
设计的分析。否则，附加的建棋假设可以融入到分析中去。他们巳经注意到次 
级抽样单位并不对公众开放这个问题，也已指出需要在大型健康调査中增加 
PSU 的数量。这些检验受限于点估计，因此他们的结论不能应用到所有的情况 
中。 P£e£fennann(1993, 1996) 擓供了更详细的关于这些问题和与之相关问理 
_论， 

基于设计的分析避免可能的模型错误设定这个事实，说明利用 SUDAAN, 
Stata 和其他复杂调査分析软件的分析适合 NHANES 数据。甚至在基于设计 
的分析中，我们也使用了模型来具体说明所感兴趣的参数，但推论把抽样权重 
考虑在内了。这种情况下，基于设计的分析可称为棋塑辅助方法 (Samdal， 
Swenssoti & Wretman, 1992). 基于设计的理论依赖于大的抽样规模来对参数 
做推论。对小样本来说基于模型的分析可能是更好的选择。在数据收集中没 
有使用概率抽样时，不存在应用基于设计的推论的基础。当实质理论和先前经 
验调査支持所提议的模型时，基于模型的方法可能更有道理。 

相比在回归分析中，基于棋型的分析的构思在列联表分析中更不易理解。 
我们已经讨论了把抽样方案考虑在内时基于设计的分析的基本原理 * 正如在 
回归分析中一样4艮有必要关注加权后比例与未加权比例之间的差别。如果存 
在显著差别，我们就应该检査为什么会存在差别。在表 6. 6中，未加权比例和加 
权后比例很接近，但对髙中毕业生和具大学教育的人来说，维他命使用和性别 
的加权后比数比比未加权比数比稍微小一些，而对教育程度低于离中毕业的人 
来说，加权后和未加权比数比则差不多相同 4 两个较髙教育水平的轻微差别可 
能来自种族或其他因素。如果未加权和加权后比数比的差别大很多且归因于 
种族，我们就应该对不同的种族群体分别检验这种相 关性。 在列联表中考虑附 
加因素的作用可以通过使用 logistic 回归模型实现。 

Logistic 回归中模型的使用以及相关问题与线性回归中的一槙 一样。 对加 
权后和未加权分析进行细致检验可以提供有用的信息。在表 6. 7中，加权后和 
未加权的系数估计值类似。我们发现加权对截距项的影响要大于对系数的影 
响。表6, 7所示的分析是用 logistic 回归分析数据的一个简单的演示，并没有特 





别考虑对合适模型的 选择。 我们并没有对表 6. 8中次序 logistic 回归模型和表 
6.9 中多类别 logistic 回归模型进行类似的、没有使用权重和抽样设计的、基于 
模型的分析，因为我们并没有被设定出一个合适的包含所有相关自变量的 


嫌上所述，复杂调査数据间时需要基于棋型和基于设计的分析。基于设计 
的方法产生近¥无偏的估计值或者相关性，但标准误差可能是低 效的。 基于模 
型的方法需要在选择模型时作出假设，而错误的假设会导致相关性和标准误差 




第 7 章 I 总结 


在本书中，我们讨论了调査数据分析存在问题的各方面以及用于处理复杂 
抽样设计的使用所带来的问题的方法。重点关注的是对各种问题的理解和处 
理办法的逻辑，而不是技术操作指导。我们还介绍了准备复杂调査数据分析的 
实用指引，阐释了某些可用于执行各种分析的软件的使用。用于复杂调査分析 
的软件现在很容易找到，而且随着个人计算机计算能力的增强，许多复杂的分 
析方法也能很容易地执行。然而，数据分析者需要明确设计方法、对某些分析 
创建复合权重和对调査分析选择合适的检验统计值。因此，使用者应该对抽样 
设计以及相关的分析问思有很好的理解 • 


虽然对这些议题所介绍的材料主要是针对调査数据分析者，但我们希望这 
部分内容能同时激励调査设计者和数据制造者更加关注调査数据使用者的需 



实现更加合适的分析，同时减轻数据使用者的负担。除了提供阶层和抽样单位 


的代码，数据制造者还应该创建与设计相应的抽样权重，甚至还要包括结合了 
无应答和亊后分层调整的复合权重。 

最后，我们必须指出，我们一直是站在基于设计的统计推论立场之上的，同 
时也简要介绍了另一种方法，即基于模型的推论。这两种方法各有 优势。 简单 
来说，基于模型的推论假定样本是从概念上的超总体中得到的一组便利的观察 
值。设定好的模型下的总体参数是主要关注点,而抽样选择方案则没有推论那 
么重要。因此，在这里抽样设计的角色变得不重要了，统计估计使用的是这个 
设定好的模型下的预测方法。自然地，如果棋型设定是错误的，那么这种估计 





就会产生偏差，而且即使在大样本中偏差也可能是巨 大的。 基于设计的推论要 
求把抽样设计考虑在内，这是传统的方法。有限总体是主要关注点，分析目标 
在于在重复的抽样中找到设计无偏的估计值。 

我们相信，当推论基于抽样数据时抽样设计是非常重要的，相比那些更具 
可预测性的物理现象，社会现象中的推述尤其重要。同时，我们需要对棋型的 
恰当性进行评估，分析性模型的作用必须在所有数据分析中得到重视。同时使 
用设计和模型的推论相比只单独使用其中一种的推论可能更加成功。我们还 
相信,这两种不同的方法是互补的，联合使用两者会有 益处。 Br eWe ra995, 
1999)， Sundbe r g(1994) 也陈述过类似的观点。[ 7 ]我们既不能忽略那些在社会 
调査设计中普遡存在的实际性问题，也不能忽略那些一直持续的无应答及其他 


迫使我们现在只能更多地依赖传统的方法。基于模型的方法应该在消除调査 
设计和分析间的鸿沟这个问题上提供额外的思考 方法。 

B 有大量的理论和实际文献探讨了复杂调査数据的分析问題。除了本书 
所列的参考文献，另有关于本书所讨论问题及相关议题的、更深人的、独立成 
册的分析 （Kom & Graubard, 1999 > Lehtonen &■ Pahkinen, 1995 ( Skinner, 
Holt & Smith, 1989). 在对复杂调査数据进行二手分析时，分析者应该意识到 
这种分析很可能会遭到抽样设计局限甚至抽样设计错误所导致的严重破坏。 
掌握有限抽样信息的分析者很有必要向有经验的专业调査技术员进行咨询。 
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在经验社会科学研究中缺失数据的问题很普遍,大多非实验性研究所报告的统计结 
果都立足于较小的样本数，有时比初始选择个案数目还翠小9在一些变量上相对多缺失 
观察值会降低有效的0。假设有个意见调金,多变量分析中有效样本只有原来的一半， 
这种情况在现实中并不少见。假设商宇院的 “ary Rose 教授在一个消费者态度及行为 
调査中检验一个 N f 1000受访者的概率样本。她使用一*计算机选项成列崩除(也就 
是任一受访者有缺失任一模型变量即被排除），对支出估计一个合理设定的多元回归棋 
型。结果实际可得的个案降至 N = 499。这就产生了严重的问题。这499个受访者是否 
仍“代表”了总体？要拒绝零假设，样未是否太小？为了保持样本数，是否应该尝试成对 
删除？抑或,有其他新的方法值得考虑？这些问题及其他问题都在 Paul Allison 这本杰 
出的专题著作中讨论到。 

“观察值是随机缺失的”，这是根据留下的个案以面对处理数据缺失时的通常论点。 
但这个假设是隐含的。假若观察值“完全随机缺失”,这表示没有任何变最，不论是因变 
量或自变董( X ),其缺失分数都不与该变量自身的值相关。例如，上述的支出变量， 
对于支出多者其未回答率应不比支出少者的未回答率高。对于其他模型变量，假设在相 
同的条件下，则499个次样本将可代凑一次科学的抽取，允许有效的推论。而且,它允许 
回归估计值是不偏及一致的 0 无问题派的研究者可能喜欢这种 MCAR 随机性，但这需要 
有很强的假设来支持。 

较为实际一点的假设为观察值是“随机缺失的” ( MAR )。 假设在控制了其他变置后， 
如果 y 的值不能预设缺失分数的位置，则 V •变量缺失数据为随机的。所以在上述的举 
例中，职业地位( X ) 可梅与 支出的缺失数据相关，高地位的受访者更可能低报支出。一 
旦 X 在右手边，那么 y 的观察值将会是随机的。在 MAR 情况下，如 Allison 所言,缺失数 
据产生机制是可忽略的。虽然他也论及不可忽略的缺失数据机制的困难细节，但他这本 
专题著作着重于在 MAR 条件下, |S (改& 彳$十处理的方法。 

如果数据是 MAR , 則估计的质量很大程度地取决于系统性误差的位置。令人鼓舞 
的是,当相关缺失数据仅限于自变置时,则成列涮除仍能产生不偏的估计值。例如,在例 



子中，职业地位 A ■缺失数据可能与另一个自变最年龄 (Z) 相关 :例如:没有 报告年龄的可 
能年纪较大且地位较高。在年龄较大与报告支出缉有相关的条件下，则没有误差。亊实 
上，正如 Allison 巧妙论证的，在_些 MAR 情况下，标准成列删除选项比传统缺失数据修 
正方法 ( 成对删除,虚拟变量调整或平均值替换)表现更好。 

处理缺失数据问题的新策略占用了本专题论著的大部分篇幅。在缺失数据的条件 
下回頋最大似然估计，即 ML 估 i 1 ! ■，他 以一 选的美国大专院校毕业率的数据 
例，解释了插补法的 EM 算法。后几章超越了 ML 方法,解释多重插补方法，并讨论了不 
可忽略的缺失数据。这本书是最新的处理缺失数据的楕心杰作，几乎所有的统计书箱都 
很少涉及这个主理。 Paul Allison 也睿智地提醒我们,缺失数据最佳的解决方法是“没有 
任何最佳解决方法"。但如果你也有 这个时 题且在粤求补救方法，那么就请阅读本书的 


^■^5 苛:路易贝克 (Michael S. Lewis-Beck) :: 



第 1 章 I 导论 


任何做统计分析的人早晚都会遇到缺失数据的问题。在一个典型的数据 
组中，对于某些个案信息是缺失的。例如，在要求个人报吿其收入的调査中，通 
常很大比例的受访者会拒绝回答。彻底拒绝只是造成缺失数据的一个原因。 
而在自己填答的调査中，人们通常会漏看或忘记回笞一些问理 s 即使是专业的 

调査员偶尔也会忽略某些问题。有时候受访者说他们只是不知道如何回答或 

者是没有可用的信息，而有时候某些问题对于一些受访者是不适用的，如让未 

婚者评价他们的婚姻质量。在长期的研究中，这一波被访问的人在下一波调査 
前可能会死亡或 搬走。 当数据从多个行政记录中收集得来时，有些记录可能也 
会不慎缺失。 

因为有这些和其他许多的原因,导致缺失数据在社会和健康科学两者中， 
成为了一个贄遍存在的问题。为什么它会是个问题呢？因为几乎所有标准统 
计方法都假设每个个案具有可用于分析中的所有变暈的 信息* 确实，大多数的 
统计教科书没有提到任何有关缺失数据或如何处理缺失数据的信息。 

一个众所周知、通常为统计软件默认的、简单的解决方式是:在分析中当某 
个案的任何变量具缺失数据时，便简单地将该个案从分析中排除。结果便得到 
—个没有缺失数据的数据组，可以使用任何传统方法分析。这个策略通常被社 
会科学称之为成列删除或个案删除，但有时也会被称为完整个案分析。 

除了简单以外，細删除也有一些吸引人的统计特质，这将会在后面讨论。 
对任何使用过“成列删除”的人而言，它也有一个明显的重大缺点 :在很 多运用 
中，成列删除会排除原始样本的一个很大的比例。例如，假使你已收集了一个 
样本为1000人的数据且想要估计一个有20个变量的多元 回归。 每一个变量都 










是好的，也不存在唯一真正解决缺失数据的好的方法。所以在设计和执行研究 
计划时，必须尽力使缺失信息的发生最小化。因为统计调整没有办法补救草率 







I 假设 


研究者通常会试着使那些在某一特别变量上有缺失值的个案与其他有观 
察值的个案变得没有楚异。例如他们通常会提供证据说明报告和不报告其收 

人的人们在其他各变量上没有显著差异 # 更普遍地，研究者通常声称或假设他 

们的数据是随机缺失的，却没有完全理解这代表什么意思。统计学者过去甚至 

也曾对此概念感到模糊或模棱两可。然而， Rubin (1976) 通过严格定义那些关 

于缺失数据机制不同的合理假设，将这些事物立足于一个坚固的基础上 • 虽然 
他的定义相当具技术性，但在此我将试着给出一个通俗的理解。 

完全随机缺失的 

假设一个特殊变量 Y 有缺失数据。如果 Y 数据缺失的概率与 Y 本身的值 
或在该数据组中任何其他变量的值都无关的话，那么 Y 的数据可以说是完全随 
机缺失的 (MCAR〉。 当这个假设满足所有变量，有完整数据的个人组可被视为 
原本观察值组中的一个简单随机次样本。要注意 MCAR 不考虑 Y 的“缺失”与 
其他某个变量X的“缺失”相关之概率。例如，即使拒绝报告其年龄的人们总是 
拒绝报告他们的收人，但该数据仍然可能是完全随机缺失的。 

如果平均而言不报告其收人的人们比那些报吿收入者年轻，薄么 MCAR 
假设会被违反。很容易就可检验这个暗示，通过将该样本分为两组一报告收 
人者和未报告收人者，再检验他们的平均年龄的差异。如果实际上有数据呈现 
者和有数据缺失者两者间在所有观察变量上都没有系统性的差异，則该数据可 
以算是随机观 察的。 另一方面,仅由数据通过这个检验并不能说明 MCAR 假 















要非常好的关于缺失数据过程本质的基础知识，因为数据没有包含信息告知什 
么模型是适当的，而且结果会对模型的选择尤其 敏感。 因为这些原因且因为不 
可忽略缺失数据的模型要求对每个运用必须相当专业化，因此这本书主要将重 
点放在可忽略的缺失数据上。在第7章，作者简短地分析了一些处理不可忽略 



I 传统的方法 


虽然有许多不同的方法被提议用来处理缺失数据，但其中只有一些获得了 
普遍欢迎。但这些被广泛使用的方法中没有任何一个明显优于成列删除•在 
这部分，我从最简单的方法开始，简短地回頋一些 方法。 在评估这些方法时，我 
将特别关注锥们在回归分析中的表现(包含 logistic 回归及 Cox 回归〉 ，许多评 
论也适用于其他类型的 分析。 


成列删除 


如前所述，成列删除通过从样本中胭除所关注模型中的在任何变量上有缺 
失值的观察值，并通过运用传统分析完整数据组的方法来 实现。 成列删除有两 
个明显的优点:（1)它可以用于任何类型的统计分析，包括从结构方程模型到对 
数线性分析》 (2) 并不需要特别的运算方法。根据缺失数据机制，成列删除有一 
些吸引人的统计特性。明确地说，如果数搪为 MCAR, 则减少的样本将会是原 
样本的一个随机次样本。这意味着，对于所关注的任何参数，如果估计值对于 
完整的数据组(没有缺失数据)的估计值是无偏误的，那么对于成列删除的数据 
组也会是无偏误的。此外，由成列删除的数据组所获得的标准误及检验统计量 
也如同它们在完整数据组中的一样适当。 


大。它们也会倾向大于(在本书后面叙述的〉由最适当的方法所获得的标准误， 
但至少你不用担心因为缺失数据而导致推论错误=这是大多数常用方法的 





另一方面，如果数据不是 MCAR， 而只是 MAR， 那么成列删除可能会产生 
有偏误的估计值。例如，如果教育缺失数据的概率取决于职业地位，那么对职 
业地位进行关于教育的回归将会产生一个有偏误的回归系数估计值，因此，一 
般而言，成列删除对于违反 MCAR 假设的情况并不是稳健的。但出乎意料的 
是，成列删除对在回归分析中的自变量间违反 MAR 时是最稳健的。更明确地 
讲，如果任何因变量缺失数据的概率不取决于自变量的值，则使用成列删除的 
回归估计值将会是无偏误的(如果所有一般回归棋型假设都被满足的话)。 [1] 

例如，假设我们想估计一个回归模型以预测年储蓄,其中一个自变量为收 
入，有40%的数据是缺失的.进一步地假设收人缺失数据的概率取决于收入和 
教育年数两者，教育年数为棋型中另一个自变量。只要缺失收人的概率不取决 
于储蓄，回归估计值将会是无偏误的 (Little, 1992). 

为什么会这样呢？有一个重要的原因。对回归模型的自变量做非比例分 
层化抽样并不会使系数估计值产生偏误。一个仅与自变量值相关的缺失数据 
机制在本质上与分层化抽样相同,也就是说，个案以基于其他变量值的概率而 
被选择进人样本中。这个结论不只适用于线性回归模型，也适用 logistic 回归、 
Cox 回归、泊松回归及其他。 

事实上，对 logistic 回归而言，甚至在更广泛的条件下，成列删除都能给予 
有效的 推论。 如果任何变量缺失数据的概率取决于因变量的值，而不取决于任 
何其他自变量的值，则使用成列删除的 logistic 回归会产生一致的斜率系数估 
计值及其标准误 (Vach, 1994)。然而，截距估计值将会是有偏误的。只有在当 
任何缺失数据的概率同时取决于因变量和自变量两者时，使用成列雇除的 lo¬ 
gistic 回归才会是有问题的 。[2] 





对于这些关于回归分析的成列删除的主张有一个重要的提示。即对于样 
本中的所有个案回归系数都被假设是相同的》如果回归系数在横跨总体的次 


回归系数向其中一个或另一个次集合倾斜。当然,如果在回归参数中察觉到这 
样的变化，就应该对不同的次样本做不同的回归，或将适当的交互作用包含在 
模型中 (Winship & Radbill, 1994). 

成对删除 

也被称为可得个案分析，成对劚除作为一个简单的备选方法可用于许多线 
性模型，包括线性囬归、因子分析及更复杂的结构方程 模型。 它是广为人知的， 
例如，一个线性回归可以通过其样本平均数和协方差矩阵，或相同的，通过平均 
数、标准差及相关矩阵进行估计。成对删除的原理是要通过所有可得的个案来 
计算这些播述统计的每一个 * 例如，计算两个变量X和 Z 之间的协方差，所有 
同时具备X和 Z 两者数据的个案都会被使用。一旦总和测釐值被计算出来了， 
它们就可用于计算我们所关注的参数，如回归系数。 

如何执行这个原则却显得模棱两可。当计算需要每一个变量其平均数的 
协方差时，只使用这两变量都有数据的个案来计算平均数吗？还是使用所有变 
量的数据都可得的个案呢？因为所有的变异都产生具相同特性的估计量，所以 
毋需考虑诸如此类的问题。一般的结论是，如果数据为 MCAR， 成对删除就产 
生一致的参数估计值(且因此在大样本中接近无偏 误〉。 另一方面，如果数据是 
MAR ，但不是随机被酿到的，估计讎可能会严重偏误。 

如果数据确实是 MCAR, 成对删除可能会比成列删除更有效，因为更多信 
息被利用了。所谓更有效，指的是成对删除有比成列删除更少的抽样变异 (较 
小的真实标准误)。然而,这并不总是正确的。线性回归模型的分析和模拟研 
究都指出，当变量间的相关性普遍较低时，成对删除会产生更有效的估计值，然 
而，当变量间的相关性较髙时，成列删除則更好 (Glasses 1964, Haitovsky, 




这里还有另一个针对回归分析中缺失预测值 6 
人的方法 (Cohen &• Cohen, 1985)。假设某变量 X 
分析中数个自变量的其中一个。 

于1，如果没有缺失等于0。 


、。我们建立一个虚拟变量I 
J 们也建立 一^ 变童 X- ，使$ 
x * = 尸’当数据没有缺失 
X . 当数据缺失时 

其中 c 可以是任何 常数。 我们回归因变量 Y 于X*、 

I变量调整或缺失才 


-些缺失数据，X为 
:D， 如果X数据缺 


f 有变量。这个技术，被称为虚 
嫩延伸至超过一个自变量具毎 
虚拟变量调整方法明显的岁 


J 好处在于它钽用了所有可用的关于缺失数据的 





【其 Y 的预测值减去具叉平均数的个体其 Y 6 
i 有X 数据的次群体中X的效应的估计值。 

如 j£mes(1996) 所证明的，这个方法通常会产生 


遗憾的是，如 Jones(1996) 所证明的，这个方法通常会产生有偏误的系数估 
计值。 [4]— 个简单的模拟躭能说明这个问題。从具3个变量的正态分布中抽样 
产生10000个个案，这3个变量为 X、Y 和汉回归 Y 于X和 Z， 对于每个自变 
量，其真实的系数为1.0»不出意外，利用整个具万个个案的样本而得到的最小 
二乘回归系数(如表 3. 1第1栏所示)相当接近真实值。 

表 3.1 使用三种模型之仿真数据囤归 


其次，再随机地使 Z 值有1/2的概率缺失。因为缺失数据的概率与其他任 
何变暈不相关，所以该数据为 MCAR. 表 3. 1第2栏显示成列蒯除产生的估计 
值相 当璋近 那些没有数据缺失的结果。另一方面，虚拟变量调整方法的系数則 
明显有偏误—— X 系数高而 Z 系数太低。 

另外有一个密切相关的方法被提议用于回归分析中的类别自变量。诸如 
此类的变置可通过建立一组虚拟变量来有代表性地处理这个问题，除了参照组 


P 有一个变量。这个方法是简单地建立一个额外的类别及 - 
，以表示在该类别变量中具缺失数据的 个体。 然而，我们 J 
—个直觉上吸引人但即使当数据为 MCAR 时> 

Vach &■ Blettneer, 1991)。 


额外的虚拟变量，以表天 




以某些合理的猜測插补或替代缺失值，然后再接着按没有缺失数据的情况进行 
分析。当然，有许多不同的插补缺失值的方法。最简单的可能是边际平均数插 
补:对给定某个变量的每一个缺失值，都用有数据个体的该变量的平均数代替。 


众所周知，这个方法会产 
1968〉，因此通常应该避免 { 
一个比较好财蝴 


:个方法会产生有偏误的方差及协方差的估计值 〈Haitovsky， 


回归模型。其中一个自变置X，部分个案有缺失数据。对于那些有完整数据的 
个案，我们回归X于所有其他自变量上。使用相应的估计方程，我们会得到预 
测值用于具X缺失数据的个案。这些值用柴代替缺失数据，并且可以接着按没 
有缺失数据的情况进行分析。 


当超过一个自变暈有缺失数据而且一般主题有许多变异时,这个方法就会 
变得比较复杂。一般而言，如果插补是全然根据其他自变量(而非因变量〉且数 
据为 MCAR 时，最小二乘系数是一致的，暗示在大样本中几乎无偏误 (Gourier~ 
&- Monfort, 1981)。然而，它们并不是完全有效的。可通过加权最小二乘 
Little, 1975) 或广义最小二乘 (Gourieroux & Monfort, 1981) 获得改 
良的估计置„ 

遗憾的是，所有这些插补方法都面临一个根本的问應:即按照完整数据的 




情况分析插补数据会低估标准误、髙估检验统计量。传统分析分法没有单纯地 
对这个实际情况 (S 卩插补过程涉及缺失值的不确定性)进行调整。[ 5 ]后面几节会 
介绍一个解决这些问題的插补方法。 




的最大似然方法。在第5章和第6章，也会介绍几乎可用于任何设定的多重插 
补方法。如果数据是 MAR， 那么这两种方法都有不一般的特性。原则上，这些 
方法可用于不可忽略的缺失数据中，伹需要一个有关数据缺失过程的正麻的模 
型 一" 这通常难以得到。 



第 4 章 I 最大似然 


最大似然是统计估计非常普遑的方法，广泛用于处理许多困难的估计问 
題。大多数读者可能熟悉 ML 作为估计 logistic 回归模型的傰好方法。当误差 
项假设为正态分布时，普通最小二乘线性回归也是一 t ML 方法。结果 ML 特 


特性。然后，将介绍缺失数据机制为可忽略的假设下， ML 估计的基本原则 9 这 


些原则会用一个简单的列联表来说明。此聿其余的部分会给出更复杂的例子， 


目的是要根据多变量正态分布估计一个线性模型。 


回顾最大似然估计法 

ML 估计的鉢原则是，选取那些若取 M 真实的，就可最大化观察到事实 
巳被观察到的概率的值，来作为估计值。为了达到这个目的，我们首先薄要 
一个以数据和未知参敢两者的函数来表达数据的概率的 公式。 当观察值为独 
立(一般的假设)时，该样本的总体似然(概率)就是所有个别观察值的似然的 
乘积。 

假设我们要估计一个参数見如果 /G I扔为给定某个0值时，观察到 Y 单 
—值的概率，则一个有《个观察值的样本的似然值为 

L(0) = \6) 

其中 n 是重复乘法运算的符号。当然，我们仍需要确切指明 /(y 丨扔是什么。 
例如，假设 Y 是一个二分类变量,编码为1或0,且I?为1的概率。则 
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Li$) = n^ci-^) 1 -^ 

一旦我们有了称为似然函数的 L ⑻，就有许多方法确定尽可能使似然值最大化 
的沒值。 

ML 估计量有许多令人满意的特性，已知在相当广泛的条件下，它们是一致 
的、渐近有效且渐近正态的 (Agresti & Finlay, 1997)。一致性意味着估计值在 
大样本中接近无偏误。有效性意味着真实的标准误至少和任何其他相应的估 
计量的标准误一样小。 

渐近部分意指这项陈述只是接近真实的，且样本量越大则越接近。最后， 
渐近正态性意指在重复抽样中，估计值接近正态分布(同样，接近程度会随样本 











个最适化问题，后面我将介绍其中的一些方法。 

当缺失数据的模式为单调时， ml 特别简单6在一个单调的形态中，可以用 
—i- 顺序安排变量,以使样本观察值的排列情况为:如果数据对于某特别变量 
有缺失的话，那么必然地对于排在这个变量之后的其他变量数据也是缺失的。 

举一个包含有4个变量 X“ X 2 、X 3 和 X4 的例子。沿没有缺失数据， 
X 2 100%的个案有缺失数据 • 缺失了 X 2 的个案在 X 3 和 X 4 这2个变量中数据 
也有缺失。额外地有20%的个案 X 3 和 X 4 有缺失数据，但 X 2 没有缺失数据。 

单调的形态通常出现于面板研究，其中个人在不同时点退出且不再回鬮研 
究/数据中。 

如果只有一个变量有缺失数据，该形态必然是单调的。考虑一个只有X具 
缺失数据的包含2个变量的例子。 fix, 3O 的联合分布可被写成 AU 丨 y>g(y)， 
其中(:V)为 Y 的边际分布(前面已定义过)且 AOc 丨 y) 为给定 Y 时X的条件式 
分布 • 这样我们可把似然值重写为 

UX, ♦) = n*0c, I m I 0 

这个表达式与前一个表达式在两个重要方面有所 不同。 首先，第二个乘积是针 
对所有观察值的，而不只是那些有X缺失数据的观察值的。其次，参数巳被分 
成两 部分: A 表示给定 y 时 x 的条件式分布，而 f 则表示 y 的边际分布。这些 
改变意味着我们可以分别最大化似然值的这两个部分。因此，如果 x 和 y 有一 
个二变量正态分布,我们躭可以计算整个样本的 y 的平均数和方差。再者，对 
于有 x 数据的个案，我们可以回归于 r 上。得到的参数估计值可以结合起来以 
产生我们可能会关注的任何其他参数的 ML 估计值，如回归系数。 

列联表数据 

这些 ml 估计的特征可以用列联表数据非常具体地说明。假设^个简单 
随机样本200人，我们要测量2个取值可能为1或2的二分类变量X和 Y •有 
150个个案，我们现察到X和 Y， 并将获得的数据列于下面的列联表中: 




X-2 二 2 

其中，抻为 x = * •且 y = j 的概率，如果我们只有具完整数据的150个观察值， 
似然值为 

L = (M) 52 (如〉 21 (pzO 3 * (P22 ) 43 . 

受到限制，此4个概率必须加总为1。此4个概率的 ML 估计值是每一个单元 
格中的简单比率，也就是 






知 =( 嚣 )(^)= 。.抓 

( 1 )(^)-»■ 1559 
~ (||)( 5 ^ 1 ) =0 - 3591 








程。虽然多元变量正态性的假设很强，但对于没有缺失数据的变量是全然无害 
的。 此外，甚至当有些变量具非正态分布的缺失数据时(如虚拟变量），多元变 
量正态性假设下的 ML 估计值通常有好的特性，尤其是当数据为 MCAR 时 

有许多方法可以用来对具可忽略缺失数据机制的多元变置正态数据做 ML 
估计。 当缺失数据服从一单调形态时，可用先前叙述过的方法将似然因子化运 
用到用传统软件估计的条件式及边际分布中 (Marini，Olsen &- Rubin 1979). 
然而，这个方法因可能的运用而受到较多限制，而且不容易得到好的标准误及 
检麟计量的估计值。 

一般缺失数据模式可用一个称为期望最大化的算法来处理 (Dempster， 
Laird & Rabin, 1977) ，它可产生平均数、标准差(或同样地可产生平均数和 
协方差矩阵)和相关性的 ML 估计值。这些总和统计童接着可被输人到标 
准线性模型;^钦件中以得到所关注参数的一致估计值。 EM 方法的优点 
有：（1)它 艰容易 使用〆 2) 很多商业的或免费的软件都可以 执行。 同时也 





些在协方差矩阵上隐含限制的模型）。 


一个比较好的方法是直接最大化所假设的线性模型的多元变量正态似然 
值。直接的 ML (有时也称为原始最大似然)提供具正确标准误的有效估计值， 
但需要有难以掌握的专业的软件。在本章接下来的部分，我们会具体讲述如何 
使用 EM 算法和直接 ML。 

EM 算法 

当有些数据缺失的时候， EM 算法是取得 ML 估计量的一个非常普遍的方 
法 (Dempster et aL , 1977 ; McKachlan &- Krishnan, 1997). 它之所以被称为 
EM， 是因为它包含两个 步骤: 一个期望步骤，一个是最大化步骤 s 这两个步骤 
在一个迭代的过程中多次重复，最终收敛到 ML 估计值 • 

_在此我并不解释一般设定下 EM 算法的两个步骤，而是着重于它对于多变 
量正态分布的运用。这里步骤 E 即期望步驟实质上变成缺失值的回归插补。 
假设数据组有4个变置， JXi 到，且每个变量都含有不具特殊形态的缺失值》 
我们从选择未知参数的起始值，也就是平均数和协方差矩阵开始。这些起始值 
可以通过样本平均数和协方差的标准公式获得，不管是用成列删除或成对删 
除。根据参数的起始值，我们可以得到回归任何1个X于其他3个X上的系 
数。例如，假设有 一 #个案&和 x 2 都有数据，但 x 3 和； a 没有数据。我们用 






i 通常在更传统插补方案中产生的对于方差的低 
k 缺失的，那么当対嘴 X3 和 X 4 的协方差时，只 
:中，我们就用斯3农 4 +故.21代養，最后一〕 


后的残差 t 
一且! 


挪 方差。 

L 我们得到新的平均数和协方差矩阵的估计值. 


D 估计值来产生对于I 
t 到估计量收敛，即 


I从一个迭代里 


环步 WE 和步骤 M 直到估 i 
经几乎 不变。 

注意 EM 运算法避免了传统回 J 
作为自变量，并处理不同数据缺失模式有不同的自 
!开始，因此它可能得到对于任何组I 

:么少 的个案$ 


>统回归插补的一个 
fc 失模式有不同的自 
从完整协方差开始，因此它可能得到对于任何组8 
某个特别的缺失数据形态中可能存在多么少6 
可得的变量作为预8 


我们使用来自1994年美国新闻司 
关于美国1302所大专院校的数据 # ! 
GRADRAT 

LENROLL | 

PRIVATE 1 


I导对美国： 
rr 列变置： 


!新闻和世界报导对I 
m. 我们考虑下列3 

RAT 髙年级毕业生对四年前就读人数的比率(100%) 
r 语言和数学两个科目的平均分数 
L 新生人学人数的自然对数 
:1 =私立;0 =公立 
STUFAC 师生 比率⑽ ％) 

RMH) 每年食宿总支出 
act 平均 ACT 分数 










除的表 4. 2 并没有明显差异，但所得的标准误却低很多，从而导致较髙的£统计 
量和较低的/»值。遗嫌的是，在这个例子中虽然系数为真实 ML 估计值，但标 
准误确实太低，因为它们假设所有个案都有完整数据，为了得到正确的标准误 
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Mx 一个免费软件，可从 http ! //views, vcu. echj/mx 下载。 

在进行实例讲解前，让我们先回顾一下基本的理论。令 /Or 2) 为一个 

被观察向量 x、 平均数向量 p 及协方差矩阵2的多变量正态密度 • 如果我们对 


Ufi, 2) = II/<xi I fx, 2) 


为较小的向量 * 直接将缺失的元素从 O： 中去除。 令 /M 为/X 的次向量，以排除在 
取 缺失的对应的元素，且 令公为 2的次矩阵，以舾除对应于: r 缺失值的列和栏。 
我们的似然函数则变为 

L(^, 2) = II/<^ U, 2i). 

虽然这个函数看起来非常简单，但却比具完整数据的似然函数更加难以 处理。 
然而，这个似然函数可以由传统的 ML 估计方法来最大化 B 同时，我们可以取 
此似然函数的对数，对未知参数偏微分，并令结果等于0。得到的方程可以使用 
数学算法来求解，如使用产生标准误如同一个相乘组合的 Newton-Raphson 方 
法。它也可能将一结构 加于# 和2上，从而让它们成为一个相对应于某个偎设 
线性模型的、有较小组参数的函数，例如，因子模型组 
2= A®A’ + 平， 

其中 A 为因子栽荷矩阵,《>为潜在因子的协方差矩阵，平为误差成分的协方差 
矩阵。估计过程可以产生这些参数的 ML 估计值和标准误估计值。 

直接 ML 实例 

在此用同时具有使用者图解界面及文宇界面两者的 Amos 3. 6来估计大专 






院校的回归模型。图解界面允许使用者用变量中的箭头来指明方程式，因为 
作者不能做实时示蒗，故而将相同的文字命令显示于图 4. 1 中。 数据在一个叫 
COLLEGE DAT 的自由格式文字文件中，缺失数据标示为一9。 $«ntructure 
告诉 Amos 要估计指定变量的平均数，这是估计有缺失数据模型的一/ 

部分„ Sstructure 指令指明要估计的方程。紧接在等号后的括号代吴 
一个截矩。方程最后面的 （1) error f 
项，最后 一^actOerror， 考虑 AC 
因为 ACT 对于 GRAI«AT 没有直 J 
中的其他自 


J 一个必要的 
，代表要估计 
or 吿诉 Amos 要包含一个系数为 1. 0的误差 
I act 和误差项之间的相关性，这是有可能的， 
直接 效应。 Amos 自动考虑 ACT 和回归方程 


i 自变量相关。 

$ Sample size- 130 


+ rrabrd+(l)error 




对于随机袂失的数据而言，最大似然可以说是一个有效且实用的方法•在 
这种情况下，对于大样本， ML 估计值应该是最合适的 4 对于可用如 LISREAL 
程序所估计的一般的结构方程模型之线性模型, ML 估计值很容易从许多广泛 
可用的软件包中获得。类别数据的对数线性模型 ML 估计也有可用的软件，但 
在这个设定中执行比较间接。 ML 方法的一个限制条件为，它需要一个包含所 
有缺失变量的联合概率的模型。对这个目的而言，多变量正态模型通常是方便 
的，但对于许多其他的运用可能不太实际。 




虽然 ML 代表了处理缺失数据传统方法的一个重要的发展，但它也有其局 
限性。如我们巳经看到的，关于线性模型和对数线性模型的 ML 理论和软件容 
易获取，伹超出这两者之外的理论抑或软件通常比较缺乏。例如，如果你想要 
估计一个 Cox 比例风险模型或一个有序的 logistic 回归模型，你将难以对缺失数 
据执行 ML 方法 4 甚至假使你的模型可以用 ML 估计，但你也可能难以找到你 
特别需要的、专业的诊断或图形输出软件。 

值得庆幸的是，有一个备选方法 一 即多重插补，它有着与 ML 相同的最适 
特性，但却排除了某些局限性。更明确地，当数据为 MAR 时，正确使用多重插补 
(MO 会产生一致的、渐近有效且渐近正态的估计值。不同于 ML，MI 几乎可以稜 
任何一种数据及任何一种棋型所使用，且分析可以利用未修改的、传统的软件执 
行。当然, MI 也有它自身的缺点 • 它的执行可能很麻烦，且也容易出错。这两个 
问题可以通过侧好的软湘彌补来解决。但它麟命的^是，每次你侧 MI 
时，它都会产生不同的估计值(但愿差异很小)，这可能导致奇怪的情况，即不同研 
究者麵相同的方法、相同的数据却得到不同的数字。 

单一随机插补 

MI 不产生一个单一组数目的原因是，故童在插补过程中引人了随机变异。 
若没有一个随机成分，决定性的插补方法通常对有缺失数据的变*产生低估的 
方差估值，而且有时候，协方差也一样会被低估。如我们在前一章所讲到的，对 
于多元变量正态模型的 EM 运算法，可以使用残差方差和协方差估计值来矫正 




传统公式,来解决这个低估方差 / 协方差的 问翅。 然而，一个好的备选方法是随 
机抽取自每一个插补变量的残差分布，并把这些随机数宇加到插补值。另外， 


传统公式也可以用来_方差和协方差。 

这里举一个简单的例子《假设我们想要估计X和 y 之间的相关性，但 
50%的个案有 x 缺失数据》我们可以通过对有完整数据的个案回归 x 于 y， 
然后再用得到的回归方程产生有缺失 x 的个案的预测值，进而插补缺失的 x 

值。作者对一个具 loooo 个个案的模拟样本做了这种处理，其中 x 和 y 抽取 

自一个标准双变量正态分布中，两者的相关性为 0. 30。一半 x 的值被指定为 

缺失的(完全随机)。利用回归于 Y 的方法来替代缺失值后，X和 Y 的相关性 

估计为0.42« 

样本相关性是样本X：和 y 的协方差除以它们样本标准差的 乘积。 为什 
么利用了回归于 y 的方法后会髙估相关性呢？首先，回归插补方法产生无偏 
误的协方差估计值。此外 ，（ 没有缺失数据的） Y 的标准差被正确估计为 
1. 0,伹(包含插补 值的〉 X的标准差只有 0. 74,而其实际的标准差应为 1. 0。 
所以造成了相关度的高估。换一个方法来考虑这个问娌， 5 000个有缺失数 
据的个案的X插补值为 Y 的一个完全线性函数，因此增大两个变量间的相 
关性， 

我们可以通过从X的残差分布随机抽取残差并将这些随机数字加到X的 
预测值上，以矫正这个 偏误。 在这个例子中，(对 Y 回归的) x 的残差分布为一 
平均数为0且标准差为 0.9525 的正态分布(从成列删除的最小二乘回归估计而 
得人 对于个案 i， 令/«为一来自标准正态分布的随机抽取且令糸为从回归X 
于 Y 而得到的预测值。我们修正的插补值则为& = 5<+0.9525«£。对所有有 
缺失X的观察值而言，我们用替代,然后再计算相关性。当作者对这个有 


10000 个个 
关性为 0.3 


案的棋拟样本进行这种处理时，(有修正插补值的)X和 Y 之间的相 
16,只比真实值 0. 300高一些而已。 


多元随机插补 


随机插补可以消除决定性的插补所特有的偏误，但仍存在一个严重的问 







題。如果我们把插补的数据(不管是随机或决定性的)当做真实的数据来使用， 
导致的标准误估计值通常会比较低，而检验统计量会比较高。标准误估计的传 
统方法不足以说明数据为插补的亊实， 

对于使用随机插补而言,其解决方案在于不止一次地重复插补过程，从而 
产生多个完整数据组。因为随机成分，关注的参数估计值在每个插补的数据组 
中将会只有微小差异 • 横跨插补的变异可以被用来向上调整标准误。 

对于一个有着10000个个案的模拟样本，作者重复随机插补过程8次，产生 
的估计值见表 5. 1。虽然这些估计值近似反映无偏误的，但因为没有考虑插 
补[ 9 ]，所以标准误是向下偏误的 • 我们通过对这8个相关性估计值取平均值， 
得到一个单一的估计值 0.3125. 用以下3个步骤来产生改良的标准误估计值： 

(1) 估计标准误平方(以得到方差)，并对8个结果取平均值， 

(2) 对这8个复制的结果计算相关性估计值的方差； 

(3) 加总步骤1和步骤2的结果(运用步骤2中的一个对方差的小矫正）， 
并取平方根。 

将此置人一个方程中，令 M 为复制的次数, n 为复制 ife 中的相关性，《为复制是 
中估计到的标准误。则？标准误的估计值(相关性估计值的平均数)为 


s. K (?) =7'M'S s i + ( 1 +^)(Miri)S<«- ?i > !5 [ 5 . 幻 


这个方程可以用于由多重插补所估计的任何参数, r* 表示所关注参数的第 A 个 
估计值 (Rubin， 1987)。把这个公式运用于我们关注的例子中，得到标准误为 





相关性 & E . 

相关性 & E . 

0.3159 0.00900 

0. 3108 0. 00903 

0. 3135 0.00902 

0. 3210 0. 00897 

0. 3118 0. 00903 

0.3022 0.00909 

0.3189 0.00898- 

0. 3059 0. 0090$ 
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在参数估计值中考虑随机变异 

虽然作者之前描述过的插补缺失数据的方法巳经相当完善了，但它并不是 
最理想的 4 为了产生 x 的插补值，作者对有完整数据的个案回归 x 于 y 上,以 
产生回归方程 

对于 x 有缺失数据的个案，插补值计算为 

其中是一个来自标准正态分布的随机抽取，而为误差项的估计标准均 
方根差。对于模拟的数据组，我们得到= 0. 9525。这些值用来对8个完轚 
数据组中的每一个产生插? Ht。 

这个方法的问埋在于，它视 a、 6和&如同真实参数，而非样本估计值。 
很明显，我们不能得知真实值为多少，但对于“适当”的多重插补 (Rubin，1987), 
每一个插补的数据组应该基于不同组的 a、 6和值。这些应该从参数的贝 
叶斯后验分布中随机 抽取。 只有这样，多重插补才能完全体现我们关于未知参 
数的不确 定性。 

这种观点自然会产生许多疑问。什么是参数的贝叶斯后验分布？我们如 
何从后验分布中酿抽取用于插补的值？我们真的窬要这额外的复杂程序吗？ 
第一^问题需要另一本书来回答，而且幸好在社会科学的量化运用系列丛书里 
(Iversen, 1985) 有一本相关的书。对于第二个问理，有数个不同的方法可以从 
后验分布中进行随机抽取，它们有些被包含在容易使用的软 件里。 在本章稍后 
部分，当我们考虑在多变量正态模型下的 MI 时，作者将解释一种叫做数据扩增 
法的方法 (Schafer, 1997). 

如果不使用从后验分布中随机抽取的方法可以吗？这个问题的答案很重 
要，因为有一些随初插补软件，如 SPSS 中的缺失数据模块，可以随机抽取参数 
值。在许多例子中，作者认为答案是可以的 • 如果样本够大且有缺失数据的个 



案比例很小，那么缺少这个额外步骤的 MI 就更容易产生非常接近那些包含这 

个額外步骤的结果》另一方面，如果样本小或有缺失数据的个案比例很大，则 

额外的变异可以产生明显的 差异。 

继续我们所关注的例子。作者用数据扩增法插补8个新数据组，以从参数 
的后验分布中产生随机抽取。表 5. 2提供X和 Y 间的相关性及每一个数据组 
的标准误。相关性估计值的平均数为 0. 31288。使用方程5.1，估计标准误为 
0. 01329,比由较粗糙的插补方法所获得的 0. 01123稍大 * —般而言,当用于插 
补中的参数为随机抽取时，标准误会略显较大。 

表 S.2 使用数据扩增法的随机插朴数据之相关性与标准误 



在多变量正态模型下的多重插补 

为了做多重插补，你需要一个模型以 产笙插 补值。对于刚才考虑过的两个 
变量的例子,作者利用一个具正态分布误差的简单回归模型。很明显，更复杂 
的情况需要更复杂的模型。然而，对于模型的选择来说， MI 可能没有 ML 那么 
敏感，因为模型只用来插补缺失数据，而不用来估计其他参数。 

理想的情况是，我们会特别建构插补模型以代表每一个数据组的独特的特 
征。在实际应用中，利用便于使用的、且适用于广泛数据组的、合理良好近似反 
映的、现成的模型会更加方便。 

MI 最受欢迎的棋型为多变量正态模型，也就是先前在第4章使用过的、具 
缺失数据的线性模型的 ML 估计的基础。多变量正态模型意味着： 

(1) 所有变量都有着正态分布； 
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(2) 每一个变量可以用所有其他变置的一个线性函数以及一个正态、同方 
差的误差项所表示 • 

虽然这些是很严格的条件，但实际上，即使当有些变量已经明确不是正态 
分布时，多变量正态模型仍然可以实现好的插补 (Schafer, 1997). 对那些没有 
缺失数据的变量而言，这是一个完全无害的假设。而对那些有缺失数据的变量 
而言，正态化转换則可以大大地改善插补的质量。 

本质上讲，多变量正态模型下的 MI 是前述两变量例子中使用过的方法的概 
括》对于每一个有缺失数据的变量，我们估计该变量对于所有其他受关注变量的 
线性回归。最理想的结果是，回归参数是从贝叶斯后验分布中随机抽取而得。估 
计到的回归方程接着用来产生有缺失数据的个案的预測值。最后,对每一个预测 
值，我们加上该变量残差正态分布的一随机抽取值。 

插补过程中最复杂的部分是从贝叶斯后验分布中得到随机抽取值。在作 
者写作本书之时，巳有两种用以实现随机抽取的算法可用现有的软件执行:数 
据扩播法 (Schafer, 1997) 及抽样重要性/重抽样 (SIR^ Rubin, 1987). 这里给 
出一些执行这些方法的计算机程序： 

数据扩增法 

NC»M 由 Schafer 开发的免费软件,并在其1997年出版的书中叙述过，作 
为一个独立的 Windows 版本或 S-PLUS 的一个程序库，相关资料参见 http:// 
WWW. stat psu. edu/HV. 

SOLAS 一个独立的商业套装，包含数据扩增法(版本 2 及更髙版本)和一 
个倾向评分方法。后者在许多应用 上：* 无效的 (Allison, 2000). 相关资料参见 
http t //www. statsolusa. com, 

PROC MI —个 SAS 程序，可于 8.1 或更髙的版本中使用，相关资料参见 

抽样重要性/重抽样 

AMELIA 一个由 King, Honaker, Joseph, Scheve 及 Sngh(1999) 开发 
的免费 套装。 作为一个独立的 Windows 程序或 Gauss 的一个模块使用。相关 





两种算法理论上都有一定的合理性。 SIR 的提倡者 （King，Honaker, 
Joseph &• Scheve, 2001〉宣称它需要极少的计算机运算时间 》 然而，这两种方 
法的相对优越性尚无定论。因为作者有较多关于数据扩增法的经验，因此将会 
在本聿接下来的部分着重介绍这个方法 • 


多变量正态模型的数据扩増法 

数据扩增法是马尔可夫链蒙特卡尔运算法的一种形式，一个寻找后验分布 
的普进方法，在贝叶斯统计学中越来越受欢迎。在这个部分，作者将叙述它如 
何处理多变量正态模型。虽然现成可用的软件可自动执行大部分的运算，但对 
于实际进行过程而言，有一个普遍的理解是有帮助的，特别是当事情出错时。 

迭代算法的普遍结构与在前一章叙述过的多变量正态模型的 EM 算法很 
像，但它还需在两个时点做随机抽取，接下来作者会叙述这点差异。在开始 DA 
前，必须选择用于插补过程的一组变量。这组变量很明显应该包含所有有缺失 
值的变量，以及其他在模型中»要进行估计的变童。同时也应该把不在目标模 
型中但与具缺失数据的变量髙度相关的、或与那些具缺失数据的变量的概率有 
关的、额外的变量包含进来。 

一旦选定变童后， DA 包含下列步骤： 

(1) 选择参数的起始值。对于多变样正态模型，参数为平均数和协方差矩 
阵。起始值可以利用成列删除或成对綳除的标准公式 得到。 有在前一聿叙述 


过的用算法而获得的估计值 j 
(2) 用平均数和协方差的当1 
、有缺失数据的； 
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题:需要多少次的迭代才能得到缺失数据和参数的联合后验分布的收敛值？如 
使用在 EM 运算法中的最大似然迭代估计，估计值会收敛到单一组的值。接着 
收敛可以很容易地通过检査从一个迭代到另一个迭代参数估计俥改变的大小 
来进行评估。另一方面，对于数据扩增法，运算会收敛到一个概率分布，而非单 
—组的值。很难确定收敛亊实上是否达成》虽然有些诊断统计量可以用来评 
估收敛 (Schafer, 1997〉,但它们根本不可靠。 

在大多数运用中，迭代次数的选择都是胡乱瞎猜。关于其可能的范围，为 
了给出一些提示, Scha£er(1997) 在他书里的例子中，使用介于50到100之间的 
迭代次数。次数越多越好，但每一次迭代其运算强度可能很大，特别是对有许 
多变量的大样本 来说。 指明一个较大的迭代次数可能会让你长时间痛苦地盯 
着你的屏幕。 

有许多原则要谨记在心。第一，缺失数据(亊实上是缺失倌息，与缺失数 
据不大相同)的比例越高,就需要越多次的迭代以达成收敛。如果只有5%的 
个案有缺失数据，你用小数目的迭代次数就可能过得去•第二, EM 运算法的 
收敛速度是数据扩增法收敛速度的有效暗示和征兆。一个好的经验法则是， 
DA 的迭代次数至少要与 EM 所需的迭代次数相同。这也是为什么总在数据 
扩增法之前进行 EM 的另一个原因(第一个原因是 EM 为数据扩增法提供了 
良好的起始值)。 

作者对于迭代法这个议通的感触是，在大多数的运用中它不是那么重要 # 
从决定性的插补到随机的插补是一个巨大的改进，甚至就算这个随机插补其参 
数并不是随机抽取的，也已经是巨大的改进。而从没有随机抽取参数的随机插 
补到有随机抽取参数的随机插补是另一个大的改进，但这个改进毫不起眼。从 
迭代次数少的数据扩增法到迭代次数多的是更进一步的改进，但在大多数运用 
中，其边际回报可能相当小。 

另一个复杂性来源于多重插补产生多元数据组的事实。至少需要两个数 
据组，越多越好。给定固定的运算时间 * 我们可以产生更多数据组，或对每一个 
数据组产生更多次数据扩增法的迭代。可惜的是，有着很多缺失信息的数据组 
同时需要更多的迭代和更多数据组。虽然有关这个议題写得很少，但作者更倾 
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好，甚至当分布明显不是正态的时候 (Schafer, 1997〉，然而，有一些技巧可以改 
善插补非正态变量的正态模型的绩效。 

对于髙度偏态量化变童，在执行插补前先转换这些变邐:以降低偏度，通常 
是有帮助的。任何可以胜任这项任务的转换应该都是可行的。在数据已经被 

插补后，相反的转换可以运用来将该变量变回其原始的度量标准状态。例 

如，对数转换能大量降低大多数收人数据的偏度 >在插补后，只要取收人的反 
对数即可。这对于有限制范围的变量帮助特别大。如果你插补收人的对数而 
非收入本身，就不可能产生小于0的收人插补值。同样地，如果要插补的变量 
是比例， logit 转换就可以防止大于1或小于0的插补 • 

有些软件可以用另一种方法处理有限制范围的问題。如果你对一个特别 
变量指明一个最大或最小值，它将会拒绝所有在这个范围外的随机抽取值，并 
简单地做额外的抽取直到它处于指定范围中。虽然这是一个很有用的可选方 
法，但使用转换以降低变量中的偏度仍是令人满意的。 

对于离散的量化变量，通常需要把插补值做合适的四舍五人以变成一个离 
散的量尺。例如，假设成人被问及他们有多少个小孩*对这个问題的回答，其 
分布会是典型的偏态，所以可以通过运用对数或从平方根转换开始。在插补 
后，反向转换将会产生非整数的值。这些可以被四舍五人取整数以符合原始量 
尺。有些软件可以自动执行诸如此类的四舍五入。 

若完全是类别的变量又怎样呢？虽然有方法和计算机程序设计仅用于只 







易理解且简单易做了。 














很多数据分析包含探索工作，在其中分析实验的各种方法和棋型。对于任 
何已经做过这种工作的人而言*多重插补的过程似乎问题比较大 • 对数个数据 
组同时执行探索分析必然是一个煩琐的 过程。 此外，对每个数据组的分析也可 
能建议使用有细微差异的模型，但多重插补对所有数据组要求一个相同的 
模型。 

解决方法很简单，但却显得特别随意。当产生多元数据组时，只要产生比 
你做多重插补分析时所需要的多1个的数据组即可。因此，如果你想要做3个 
数据组的多重插补分析，就会产生4个数据组。之后再用这个额外的数据组做 
探索分析。一旦你决定某单一模型或小组模型，就要对剩余的数据组重新估计 
这些模型，并运用我们已经讨论过的结合结果的方法》要谨记，虽然从探索分 
析获得的参数估计值将近似反映无偏误的，但是所有的标准误会向下偏误且统 
计检定纛会向上偏误。因此，使用更加保守的准则而非通常(有着完整数据)的 
准则来衡量一个给定模型的适当性可能结果会更令人满意。 

MI 实例1 

我们现在有足够的背景知识可以考虑一个现实中的多重插补的例子•让 

我们重新回顾一下第4章中使用过的例子，一个包含7个变量测量的1302所美 

国大专院校数据组,其中除了一个变量外，所有的变量都有缺失数据，和之前 

—样,我们的目标是估计一个預测 GRADRAT 的线性模型， GRADRAT 为高年 
级毕业生对于四年前以新生身份就读的数目之比率。自变置包含除了 ACT (即 
ACT 分数之平均数)以外的所有变置。这个变童 (ACT) 被包含于捶补过程中 
以得到较佳的 CSAT (即结合 SAT 分数的平均数)预测 9 后面的变量 (CSAT) 
40%的个案有缺失数据，但对于同时有两个变量 (CSAT 和 ACT) 数据呈现的 
488个个案, CSAT 与 ACT 高度相关（ r = 0. 91). 








第一个步骤要检查变量的分布以检验正态性。直方图和正态概率图显示 
除了一个变量外，所有变量都合理接近正态分布。这个例外是高度左偏的就学 
这个变量。如同在 ML 实例中，作者使用就学的自然对数，其分布有着很小的 

使用 SAS 的 PROC 
泠性，结果已在表I 
谫太 大的数目，其茵 


为了执行数据扩增法，作者使用 SAS 的 PROCMI. 第一步是要用 EM 运 
算法来估计平均数、标准差和相关性，结果已在表 4. 4中呈现。 EM 运算法用了 
32次迭代达到收敛。这是一个不算太大的数目，其或许反映了某些变量有大比 
;而，它还没有大到意味着运用 EM 运算法或数据扩增法会有 


例的缺失数据《然而，它 
严重问题。 

这里有一个最小组姿 


L 的 SAS 命令语句以产生多重插补《 




: collimp: 

LL private sto 


college 为输入数据组(对于缺失值用点表示）的名称，而 colUmp 为输出数 i 
(包含被观察到的值与插补值)的名称。 vai •述句给予用于插补过程中的变 i 
名称。 PROCMI 的狀认值为根据一系列连续性的迭代产生的 5 个完整数据 
以 EM 估计值作为起始值，在第一次插补前才 
次在连续的插补之间的迭代 4 5个 
后面的分析。输出 | 


I补前有200次“测试”迭代。接着有100 


输出数据组包含一个新的变 J 
1组》因此，原始数据组有1302个： 

拥了一个稍微复杂的 程序： 
t = collinp seed * 1401； 


= 采用默认值，作者实际上采用了 _ 
roc mi data = ny. college out = a 
miniiMO = 0600.. 0126011 
maximum =1001410..100870031 


t 据组被写入一个大的 SAS 数据组以利于 
f 的变量 _imp U t a tion_ ，其值由1到5表示不 
102个观察值，新数据组有6510个观察值。 



选择设定对每一个变童的 


和 stufac， 最大值和最小值的理论边界为0 


和 100,对于 lenroll 和 pri 


L 如果一个随机插补值恰巧 

t 会被抽取。对 gradirat 和 stu: 

lenroll 和 private， 没有指明边界，对于 csat, rmbrd 和 act， 作者 
5量观察到的最大值和最小值。 round 选择四舍五入所有变量的插 
，除了 STUTAC 以外，它被四舍五人到小数点后第一位。 

MCMC 述句允许对数据扩增法过程采取更多控制。作者在此已指明在第 
一次插补前要有500次测试的迭代，接着在连续的插补之间有200次迭代 B 


补值至整数，除了 5 

&许对数据扩增法过程采取更多 控制。 作者在此已指？ 

有500次测试的迭代，接着在连续的插补之间有200次 i 
这些迭代能够足以达到收敛吗？答案很难确定，但我们可以试验由 Schafer 
<1997〉建议的一些收敛诊断 • 一个简单的做法是检査产生自每一个迭代的~ 
些参数值，并看所有迭代得到的结果之间是否有任何 趋势。 对于有7个变量的 
多元正态模型，参数为7个平均数、7个方整和21个协方差。不检査所有参数， 
只专注于那些牵涉有最多缺失数据的变量的参数，因为这些牵涉有最多缺失数 
据的变量的参数最有可能出现问題。对于这些数据，变量 CSAT 有40%的缺失 
数据，因为终极目标是要估计预测 GRADRAT 的回归，因此我们看一下 CSAT 
的二变量回归斜率，也就是 CSAT 和 GRADRAT 的协方差除以 CSAT 的 方差。 
图 5. 1圃出了数据扩增法前100次迭代的回归斜率值。在第一次迭代后，在斜 
率系数估计值中似乎没有特别的趋势，这也让人比车 
另一个被提议使用的诊断方法,是对所关注的I 
后值做一组自相关。目标是要在插补间有足够的迭代，从而使自相关为^使 
S： 部系列1300个迭代，图 5. 2画出了具不词滞后值的二变量回归斜串值间的 


:人比撇心 . 

:注的参数于连续迭 f 


用全部系 
自相关， f 


目此最左边的值 0. 34代表距离为一个迭代远的金 
〖两个迭代分开的参数值间的相关性。虽然这两> 


矣这两个初始值比较离，但自 
相关迅速降低至相当低的值(落在0的 0. 10间），明显有一个随机的形态 4 这两 
个诊断结合一起，建议我们在插补间可以使用远少于200次的迭代。多做一些 
迭代没有什么不利，而且这里使用的诊断不保证会达到收敛。 
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回归模型： 


model gradrat = csat lenroll private ： 




-次群体分别估 
卜叫做 estimate 


这组述句吿诉 SAS， 要对由5 t_itaput a ti 0n Jft 所定义的每一个次群4 
计一个回归 棋型。 outset = estimate 要求回归估计值被写人一个叫做< 

的新数据组，而 covout 要求回归参数的协方差矩阵被包含进该数据组中。这使 
得在下一步骤中结合估计值显得容易。5个回归结果显示于表 5.3 中。很显 
然，每一个回归到另一个回归具有很大的稳定性，但也有值得注意的变异，归因 
卜 4 这些回归的结果用另一个叫傲 MIANALYZE 的 SAS 程 
碉述句 引起： 


于插补的随机成分 * 这些回归的结果用多 
序，整合成一个单一^计 值组。 由下列述4 










因缺失数据导 

















会远大于观察值的数目。但毋需担心，因为任何大于150左右的数目会造成- 


最后一栏缺失信息比是因缺失数据导致每个系数有多少信息缺失的估计 
值。其范围比 lenroll 的低21%,离于 rmbrd71%。 对于有着40%缺失数据的 
nnbrd 而言，有高的缺失信息并不令人吃惊，但对于没有缺失数据的 private 及 


特定变暈的缺失数据，也取决于与其相关的其他变*之缺失数据百分比。其 
次， MIANALYZW 程序没法知道每一个变量有多少缺失数据。相反，缺失信息 
估计值全然立足于回归内和回归间的相对变化。如果在回归间有大的变化，则 
暗示有较多缺失信息。有时候缺失信息比以 y 表示，用我们刚定义过的两个统 


同时我们要明确，在表中报告的缺失信息比可能只是一个受到大量抽样变化所 
影响的估 计值。 

如前所述，多重插补的麻烦之一是它不会产生一个确定的结果，每次执行 
多重插补，都会得到有些撖差异的估计值和相关的统计量 4 为了理解这点， 
我们看一下图 5. 4,其立足于由一个全新的数据扩增法运算所产生的5个数据 
组，虽然 lenioll 和 private 的缺失信息比之前的低很多，但大多数的结果与图 





当缺失信息比较高时，多于平常建议的 3 到 5 个完整数据组可能是有必要 
的，从而得到稳定的估 计值。 那么到底需要多少数据组呢？ 一个有着无限数目 
数据组的多重插补为完全有效(如同 ML), 但具有限数目数据组的 MI 不能达 
到全然有效。 Rubin(1987) 证明了一个根据 M 个数据组的估计值与一个根据无 
限数目数据组的估计值,两者之相对有效性为 （1 + y/M)、 其中 y 为缺失信息 
比《这暗示有 S 个数据组和50%的缺失信息，其估计程序的效率为91%。有 


数目的数据组所提供的标准误大 2. 其结果是，即使有着50%的缺失信息， 
但5个数据组已表现得相当好了，将数据组数目扩大至其两倍，可以将过童的 
标准误减半，但此时的标准误已经很小就不需要再这样 做了。 

在结束回归实例前，让我们比较图 5. 4的 MI 结果和表 4* 6的 MI 结果。我 
们发现，系数估计值相当相似，标准误和 i 统计量也一样相当 相似。 奄无疑义， 


这两个分析会得出相同的结论。 







第 6 章 I 多重 插补: 复杂化 


MI 中的交互作用和非线性 

虽然我们之前叙述过的方法对于估计有缺失数据的变 S 的主要效应有非 
常好的效果，但它们对于估计交互作用效果可能并不理想。例如，假设我们怀 
疑公立和私立大专院校， SAT 分数 (CSAT) 对于毕业率 (GRADRAT) 的效应有 
所不同。一个检验这个假设的方法(方法 1) 是取之前插补的数据，创造一个等 
于 CSAT 和 PRIVATE 乘积的新变量，并将这个新变量与已在棋型中的其他变 
暈一起纳人回归方程中。 

表 6.1( 方法 1) 最左边的一栏显示了这种做法的 结果。 变量 PRIVACAST 
是 CSAT 和 PRIVATE 的乘积 。夕 值为 0. 39,交互作用在统计上一点儿也不显 
著，所以我们可以总结为，在公立和私立机构间， CSAT 的效应没有 改变。 

表 6.1 有交互作用项的回 归:三 种方法 


INTERCEPT -39. 142 


CSAT 0.073 0.W0 0.085 0.000 0.085 0.000 

LENR(X.L 2.383 0.000 1.932 0.001 1.950 0.013 


-0.204 0.083 一 0.152 


2.134 0.002 2.44S 

-0.008 0.388 -0.024 


0.022 -0.024 0.024 









这个方法的问题是，虽然多元正态模型精于插补新产生变量间线性关系的 
值，但它并不模型化任何其他高阶动差。因此，除非使用特别的技巧，不然插补 
值不会显示具交互作用的 sag。 在这个例子中，交互作用两个变量中的其中一 
个 (PRIVATE) 是二分的,最自然的解法(方法 2) 是对私立大专院校和公立大专 
院校分别做系列的数据扩 增法。 这允许 CSAT 和 GRADRAT 间的关系在这两 
个群体间有所差异，且允许插补值反映这个事实。一旦完成分别的插补，数据 

组会重新结合成一个单一数据组，乘积变量被创造，就可用该乘积变量来运行 

回归。表 6. 1中间部分的结果显示, PRIVATE 和 CSAT 间的交互作用在 0. 02 
程度上 显著。 我们可以更明确地发现， CSAT 对于毕业率的正效应，私立大专院 
校比公立大专院校小。 

第三个方法(方法 3) 对所有具 CSAT 和 PRIVATE 的观察值的个案，在插 
补前创造乘积变量，接着再如同任何其他有缺失数据的变量一样插补该乘积变 
量，最后使用插补数据估计包含该乘积变量的回归模型。 

这个方法不如方法2那么吸弓I人，因为很明显乘积变量会有一个根本不是 
正态分布的，而在插补过程中却假设了正 态性。 然而，如同在表 6. 1右边部分所 
看到的，方法3的结果与方法2的结果非常接近，而且无疑比方法1更接近方法 
2的结果。 

方法3的结果令人放心，因为当交3作用中的两个变量都被以一量化量尺 
测置时，方法2并不 可行。 因此，如果我们希望估计一个有 CSAT 和 RMBRD 
的模型，我们需要对具这两个变量数据的476个个案创造一个乘积 变量。 对于 
其他剩余的826个个案，我们必须插补这个乘积变量作为数据扩增法过程的一 
部分。想估计一个牵涉具缺失数据的变董之非线性关系的模型时，就应该使用 
这个方法(或方法2,当其为可行时)。例如，如果我们想要估计一个有 BMBRD 
和 RMBRD 平方项两者的模型，则平方项必须被插补作为数据扩增法过程的一 
部分。这个需求会对在开始插补前就期待想要的函数形式的插补者造成一些 
负担。这也表示，我们必须从巳被其他人使用的完全线性棋型进行插补的数据 
中，谨慎地估计非线性模型 • 当然，如果一给定变置的缺失数据比例较小，我们 
选择用一个变量的原始形式插补它，随后再建构一个非线性的转换，可能会有 









插补模型和分析模型之适合性 


交互作用这个问題说明了一个在多重插补中更普进的议题。比较理想的 
I模型与用于分析的模型一致，而且两者都正确地代表该数 
!基本公式(方程 5.1) 取决于它的适合性和正确性. 

如果插补和分析的模型不同时会怎么样？这取决于差异的本质以及哪一 
>。特别要关注的是那些在一个模型中为另一个 
J 可以考虑交互作用，但分析棋型可能不行，或 
者分析模型可以允许交互作用，但插补模型可能不行。这两个例子的其中任意 
一个，如果被较简单祺型所施加的额外限制为正确的，那么我们巳讨论过的在 


麥果是，用来插补的模型 J 
L 雅标准误基本公式 
课插 补和分析的模 
!更加正确 (Schafer， 1997)。特别 
刚的情况。例如，插补模型可以^ 


标准方法的推论可能就无效。 

对于模型选择较不敏感的方法也被提议用来估计多重插补下的标准误 
(Wang&. Robins, 1998, Robins &- Wang, 2000) ♦ 很明显，当插补和分析的模 
型不兼容或者当两个模型都不正确时，这些方法给予有效的标准误估计值。然 
而，在任一阶段的不正确棋型都仍有可能产生偏误的参数估计值，而且备选方 
法需要目前尚不能获取的专业软件。 


插补中因变量所扮演的角色 


程外，对于那些有缺失数据的变量而言，至少会傾向产生虚假的小的回归系数 
(Landerman, Land &. Keper, 1997)。在大专院校的例子中，如果 GRADRAT 
不被用于插补，就会有大部分缺失数据的 CSAT 和 RMBRD, 两者的系数分别会 

降低约25%和 20% 0 同时，只有5个缺失值的 LENROLL 的系数会变大65%。 

当然，将 GRADRAT 纳人数据扩增法过程中也意味着 GRADRAT 的所有 

缺失值被插补了。有些学者就反对对因变貴插补缺失值 (Cohen & Cohen, 


1985)。鉴于此项建议，我们需要主 

数据的个案 s 这个建议有一^正兰 
用。如果因变量有缺失数据但所> 
线性的)回归棋型之最大4 
为 ML 是最合适的，在多 


S 在开始插补前，就去掉任何在因变量上有袂失 

、正当的基本理由，但它只在一些特别的例子中适 
f 有的自变量没有缺失数据，则(不论线性或非 
似然估计没有使用具缺失数据的个案的任何信息。因 
: 多重插补下插补块失个案并不会获得任何好处，事实 


上，虽然诸如此类的插补不会导致任何偏误，但其标准误会比较大„然而，当自 


变量上也有缺失数据时，情况就不同了。因变量上有缺失数据的个案，确实有 


一些可以用于回归系数估计的信息，虽然信 息纛可 能不是很大。结果是，在因 
变量和自变量两者皆有缺失数据的典型例子中，因变量上有缺失数据的个案不 


应该被删除。 


在插补过程中使用額外的变量 

如之前所提到的，用于数据扩增法的变童组确实应该包含那些将在计划分 
析中使用到的所有变量^在大专院校的例子中，我们也纳入一个额外变量 ACT 
(平均 ACT 分数)，因为其与有着大量缺失数据的变量 CSAT 高度相关。目的 
是要改善 CSAT 的插补以得到它更可靠的回归系数的估计值。如果我们包含 
其他与 CSAT 相关的变量，我们会做得更好。 

一个相对较简单的例子就能阐明额外预测变量的好处 4 假设我们想要估 
计1302所大专院校的 CSAT 平均分数，我们知道，有523个个案有 CSAT 缺失 










表 6. 2 最后一行加人了与 CSAT 相关性约为 0. 60的 GRADRAT， 但只能 
利用17个未被 PCT25 或 ACT 所涵釐的个案。丝毫不出人意料，标准误的减少 
相当小。当作者试着引人图 5. 4中回归模型的所有其他变量时，标准误事实上 
变得 更大。 这可能是由于其他变量与 CSAT 的相关性低很多，然而因为需要估 


多重插补的其他参数方法 

如我们已经看到的，在广泛的数据类型和缺失数据形态下，多变量正态模 
型下的多重插补是相当简单的.作为处理缺失数据的一个惯例方法，这可能是 
当前最好的方法。然而，有数个备选方法在某些情况下可能更为可取。 

多元正态模型最明显的缺点之一是，它只设计用来插补量化变量的缺失 





m I 


值。如我们巳经看到的，类别变量通过使用一些临时的方法来修正。然而，有 
时候你可能想做得更好。对于在插补过程中所4变量都是类别变量的情况 
下，有一个更好的模型，即无限制的多项模型(其列联表中每一个单元格都 
有一个参数)或者一个允许在多项参数上有所限制的对数线性 棋型。 在第4 
章中，我们讨论过这些棋型的 ML 估计。 SchaferU997) 也证明了这些模型如 
何能被使用以作为数据扩增法的基础，从而产生多重插补，而且他也开发了 
一个叫做 CAT 的免费软件程序以执行这个任务(参见 http,//www. stat psu. 
edu/ 〜 jW) • 

当数据包含类别的和量化变量的组合时,另十个 Schafer 程序 (MIX) 使用 
数据扩增法以产生 插补。 这个方法假设类别变量有一多项的分布，并在变量上 
可能有对数线性的限制。在由类别变量所创造出的列联表中的每一个单元格 
里,量化变量被假设有一个多变量正态分布。这些变量的平均数可以在各单元 
格变化，但协方差矩阵则被假设为固定的。 



此,这些方法的有效运用很明显需要更多来自插补执行者的知识及创造，以及 
更大的样本数以达到稳定的估计值. 


如果数据对于一个单一类别变量有缺失， logistic 回归模型下的多重插补就 
相当容易 (Rubin, 1987). 假设在编码为5个类别的婚姻状态数据有缺失，且有 
数个可能的连续的和类别的预测变量。为了插补，我们使用具完整数据的个 
案，以一个预测量的函数，对婚姻状态估计一个多-的 logit 模型。这将会产生 
一组系数估计值為及一个协方差矩阵估计值.为了考虑参数估计值间 
的变异，我们从一个平均数为》且协方差矩阵为 1( 為)的正态分布中随机抽取 
参数估计值 (Schafer 给出了如何有效实行这种操#的实用建议)。对于有缺失 
数据的每一个个案，抽取的系数值和被观察到的协变量值被代人多项的 logit 








无参数及部分参数方法 


提议用另外几种方法来做多重插补。在这个部分，作者将考虑一些比较有代表 
性的方法，但需要注意的是，这些方法中几乎每一个都会存在许多变化情况。 
虽然当数据缺失为单调形态时，这些方法通常可以毫无困难地被普遡化到具多 
元变量的情况(在第4聿已叙述 过了〉 ，伹这些方法在只有一个单一变量有缺失 
数据的情况下被运用最为自然。关于该内容可以参考 Rubin(1987) 有关单调广 
义化的内容。当缺失数据不脤从一个单调形态时，这些方法有时可以被使用， 
但在这样的设定下，它们明显缺少坚实的理论 基础令 

当在参数和非参数方法间选择时，通常要在偏误与抽样变异间有一个权 
衡。参数方法倾向于有较少的抽样变异，但如果参数模型对于所关注的现象并 
不是一个良好的近似反映时，它们可能会导致有偏误的估计值。非参数模型在 
许多情况下可能相对不容易出现偏误的情况，但估计值通常有更多的抽样 














预测值是“接近”的。从这组个案，我们随机选择一个个案的 Y 值捐瞄给该缺 
失个案。 

对于单一变量 Y， 可以直接将“接近”定义为预测值间的绝对差异 • 然而， 

接下来我们必须决定多少个接近的预测值应被包含进每一个缺失个案的捐 

赠库中？或相同地，构成可能的捐赠值组的接近的截略点应为何？如果选取 

了较小的捐嫌库，在估计值中就会有较多的抽样变异性。另一方面，太大的 

捐赠库则容易导致可能的偏误，因为许多捐赠者可能与受援者不相像。为了 

处理这个棋棱两可的情况， Schenker 和 Tayl OT (1996) 提出了一个“适合的方 
法”，根据接近预测值的完整个案的“密度”，变化每一个缺失数据个案捐赠库 
的 大小。 他们发现，该方法比其他有固定的3个或10个捐赠库的方法稍微好 
些。然而，这三个方法间的差异太小以至于该方法几乎不值得我彳 n 去花额外的 
將 成本。 

执行预测均数匹配时，因为回归系数只是真实系数的估计值，因此做些调 
整也是必要的。和参数的例子一样,这可以通过在计算每一个插补数据组的预 
测值前，先从它们的后验分布中随机抽取一组新的回归参数来完成。以下给出 

(1) 对于没有缺失 Y 数据的 m 个个案回归 Y 于 X( ■-协变量的向量)，产生 
回归系数 6( —个 A X 1向量)及残差方差估计值〆； 

(2) 从一个(假设不提供信息的先验的)残差方差的后验分布中进行随机抽 
样。 可通过计算 -WsV% 1 2 3 来完成，其中 Z 2 代表从一个有 m 个自由度的 
卡方分布中随机抽取而得。 令毛] 为第一个这样的随机抽取； 

(3) 从回归系数的后验分布中随机抽取系数值。可通过从一个有着平均数 
为6及协方差矩阵 (X'JO-i 的多变量正态分布抽取所完成，其中X为一个 
X值的奶 一* 矩阵。此外 ，吣 ] 为第一个这样的随机抽取。 

有关如何执行的实用建议参见 Schafer(1997). 


对于每一组新的回归参数，所有个案产生预测值》接着对于每一个 Y 有缺 
失数据的个案，我们根据预测值建构一个捐赠者库，并随机从该捐赠库中选择 











一个 y 的观察值。虽然计算可能会变得相当复杂，但这个预测均数匹配法可以 
被广义化至超过一个 Y 变量有缺失数据的情况 ( Little , 1998). 


经驗残差抽样法 

在数据扩增法中，残差值从一个标准正态分布抽样而来，并且残差值接着 
被加到预测回归值中，以得到最终的插卒我们可以通过在线性回归所产生 
的实际残差组中做随机抽取，来修正这个方法，从而使它较少依靠参数假设。 
这可以产生插补值，其分布更像该被观察到的变量的分布 ( Rubin , 1987) ,虽然 
这个方法仍有可能得到落于允许区间外的插补值。 

如同用其他方法进行多重插补一样，存在与正确执行这个方法涉及许多相 
关的重要的细节问題。和之前一样，令 y 为有缺失数据的变量，用 m 个有观察 
数据的个案来插补洵个个案。令 X 为没有缺失数据的則个个案之 * X 1变量 
向 *( 包含一个常数项)。我们由执行前述的3个步骤开始，以获得 Y 对于 X 的 
线性回归，并且从参数的后验分布中产生随机抽取值，接着我们增加下列 
步骤： 

(4) 根据步骤1中的回归估计值,对有缺失数据的个案计算标准化的 残差： 

« ~ <3^ — */«i) 

(5) 从步骤4计箅得到的 m 个残差中抽取一个有 《 o 个值的简单随机样本 
(有替换)。 

(6) 对于有缺失数据的 w 个个案，计算 y 的插补值，如： 

y* - 6[ i]*i + s [ i ] e ,- 

其中 ft 代表步骤5中抽取的残差，而 6 D ] 和 sw 是从参数的后验分布的第 
一次随机抽取得到的值。 

这6个步骤产生一个完整的数据组。为了得到额外的数据组，简单地重复 
步骤2到6即可(除了不应该被重复的步骤4以 外〉， 

Rubin (1987) 曾经解释过，这个方法可以很容易被延伸至数个变量上有着 
单调缺失形态的数据组。当其为缺失时，每一个变量使用所有被观察到的变量 





大专院校， BOARD 的平均值为20601 
BOARD 运用 EM 运算法，我们得到I 
误)。 BOARD 和 TUITION 间的 EM4 












这个过程，以产生 5 个完整的数据组(数据组数目与被 g 到的个案数目匹配到 
每一个缺失个案的数目相同只是巧合里了)。接着对每一个数据组计算平均数 



列删除而得的平均数。 Schenker 和 Taylor (1996>建议，虽然参数和部分参数插 
补方法倾向产生相似的平均数结构(包含回归系数)的估计值，但它们可能对于 
插补值的边际分布产生更加不同的结果。他们的模拟研究显示，对于主要关注 
点是边际分布的应用，部分参数模型有一个明显的优点。当被用来产生估计值 
的回归以许多方式被错误设定时，更是如此。 

连续的广义回归模型 

数据扩增法的吸引力之一是，不像其他刚讨论过的参数或半参数方法，它 


需要对所有变惫指明一个多变量分布，而当变量有着多种类型的时候(例如，连 
续的、二元的及计数 数据〉 ，这并不是件容易的事。有另—种方法被提议用来处 
理有着数种不同变置类型的大的复杂数据组之缺失数据。不拟合一单一综合 
模型(例，多变量正态），而是对每一个有缺失数据变釐分别指明一个回归模型。 
这个方法涉及在数个回归模型中循环,在每一个步骤插补缺失值。 

虽然这个方法非常吸引人，但它却不傈我们已讨论过的其他方法那样具有 
很强的理论上的有效性，在本书写作之时，详细的论述只有 Brand(1999),Van 
Buuren 和 Oudshoom 以及 Raghunathan, Lepkowski, Van Hoewyk 和 Soloi- 
be r g er a999> 等人未发表的报告•在 Raghunathan 等人关于此方法的论述中， 
可利用的樓型包含正态线性模型、二元 logistic 回归、多項 logit 及 poisson 回 
归。回归模型以一个特定顺序来估计，从有着最少块失值的因变量进行到有最 







第一个“回合”的估计进行如下。回归 h 于:X，并用相似于“对于多重插补 
的其他参数的方法”部分巳叙述过的、对多项的 logit 棋型产生插补值的方法以 
产生插#可以对插补值设定边界和限制。接着，回归于 x •和乃，包含 
Yi 的插补值，并且产生的插补值。接着回归于 x、Yi 和 y 2 (含两个 y 
的插补值),继续宜到所有回归都被估计过了。第二个和后续的回合重复这个 
过程，但现在每一个变量要对所有使用从前面步骤产生的插卒 Mi 的其他变貴做 
回归。这个过程继续至某一个预先指定的回合数目或直到出现稳定的插 补值。 
一个可以完成这些任务的 SAS 的宏命令可参见 http://ww.isr. umich. edu/ 

Van Bu_ 和 Oudshoonn 把他们的这个方法命名为基于链式方程的多重插 


补，而且他们开发了 S-PLUS 程序以执行它（参见 htt P! //www. multiple^ 
puation. com/、 他们的力 1 去和 Raghunathan 等人的方法的主要差异在于不包含泊 
齡布綱于插娜的臓抽取;^允许有更多的选择 (總 錄和部分雜)。 





憾的是，需要矩阵代数学 6 假设我们想要估计一XI参数向量 P。 我们有估 
计值 P 和估计的协方差矩阵 C， 我们想要检验一个表达为 Lp = C 的线性假设， 
其中 L 为一个 rXp 的常数项矩阵，且 c 为一 ^rXl 常数项向量。例如，如果我 
们想要检验 P 的前两个元素彼此相等这个假设，我们需要 L = [1 - 1 0 0 0… 
0] 及 c = 0, Wald 检验的计算如下： 

W = (Lp - c〉'[LCL']a4 — c> ， [6.1] 


的近似反映卡方分布。[ 13 ] 


现在我们广义化这个方法到多重插补的情形中。不用 p， 我们可以使用 i， 
即横跨数个完整数据组的估计值之平均数，也就是， 


其次我们需要一个结合样本内变异与样本间变异的协变量矩阵的估计值 。令 
Ck 为在数据组4中的参数估计的协方差矩阵，且令亡为那些横跨 M 个数据组 
矩阵的平均。样本间变异被定义为 



协方差矩阵的结合估计值則为 

C = C+(1 + 1/A4)B 

这只是方程 5. 1的没有平方根的一个多变量广义化 • 我们用包含 g 和 C 的方 
程 6. 1,来替代爸和 C， 以得到我们的检验统计量。 

遗憾的是，在典型的 M 小于或等于5的例子中,这起不到好的 作用。 在诸 
如此类的例子中， B 是一个对于协方差矩阵相当不稳定的估计鼉，且造成的 W 
的分布不是 卡方。 SchafeK1997) 给予一个对协方差矩阵更加稳定的估计量，但 
这需要不合理的假设，即假设对于$的所有元素,缺失信息比都相同。然而，有 
些模拟研究显示，即使当假设被违反时，这个备选方法仍行得通 9 这个方法已 



如果感兴趣的模型通过最大似然来估计且没有缺失数据，通常通过计算似 
然比卡方检验来执行多参数检验。这个程序相当简单•令/0为强加假设时模 
型的对数似然，并令 A 为放松假设时模型的对数似然 # 似然比统计量即为 L = 

与之前一样，我们的目的是要将这个广义化到多重插补中 • 第一个步骤是 
要对 M 个完整数据组中的每一个执行想要的似然比检验。令I：为横跨 M 个数 
据组的似然比卡方的平均数，这是较容易的部分。接下来是比较困难的部分 • 
为了得到那些卡方，必须要在每一个数据组中估计两个模型，即有强加假设的 
模型和放松假设的模型。令为强加假设时， M 个参数估计值的平均数，且令 
k 为放松假设时， M 个参数估计值的平 均数。 在每一个数据组中，我们接着计 
算一个参数值被限制为 po 的模型的对数似然，且再次计算一个参数值被设为 
Pi 的模型的对数似然(这明显需要能够 i 憤和报告使用者指定参数值的对数似 
然比的软件)。根据这两个对数似然，在每一个数据组中计算一个似然比卡方 • 
令 L 为这些横跨 M 个样本的卡方统计量的平均数， 

最终的检验统计量则为 L /( r + (@)(1：一1))，其中 r 为假设所强加 
的限制 数目。 在零假设下，这个统计量有着近似反映分子自由度为 r 的 F 分 
布。分母自由度的计算有点 困难。 = 且令 



如杲 <>4,則 A cl f. = 4+<i-4)Cl+(l-2A)/9] 2 . 如果 *<4, Hlddf. = 


结合卡方嫌计量 




而且它们需要有专业选项及输出的分析软件，这是我们通常都尽量避免的。 

作者现在讨论一个容易从标准输出所计算的第三个方法，但该方法可能不 
像另外两种方法那样精准 (Li, Meng, Raghunathan & Rubin, 1991). 该方法 
所猶要的仅是计算在 M 个完整数据组中，每一个数据组的传统的卡方统计量 
(Wald 或似然比)，以及相关的自由度。 

令 4 为数据组是中有藿自由度为 r 的卡方统计量，令孑为 M 个数据组的 
这些统计量的平均数，且令4为 M 个数据组的卡方统计量的平方根的样本方 
差，也就是 

被提议的检验统计量为 

1 + C1 + 1/M-1)4 

在零假设下，这个统计量有奢近似反映分子自由度为 r 的 F 分布•分母自由度 
近似反映 


* (^)( 1+ ( m+vm)4) 2 

作者已经写了 一^ SAS 的宏命令 (COMBCHI) 以执行这些运算和计算 一 ^ /> 值。 
该命令可以参见作者的网站 (httpj/ww^. ssc.upena edu/ 〜 Allison) 。你只需要 
键人数个卡方值以及自由度，宏命令就会报告一个 p 值, 


MI 实例2 

让我们考虑另一个详细的经验实例来说明本章所讨论过的某些技巧。数 
据组来自1卯4年综合社会调査，共有2992名受访者 (Davis & Smith, 1997)。 
我们的因变量为 SPANKING,— 个对于“有时候管教一个小孩责打是必要的。 
你强烈赞成、赞成、反对或强烈反对”这个问理的回答。如同问題本身所提示 















































26,其值为 54. 9、 59. h 66. 7、 85. 4 和 59. 0,每一个都有一个 /J、 于 0. 001 的 p 
值。然而，当用宏命令 COMBCHI 结合这些值时，得到的 p 值为 0. 45,为什么 
个别的多值和结合夕值间会有这么大的差异呢？其笞案在于，在卡方间的大的 
方差表示它们中的每一个可能都是严重高估 的值。 结合它们的公式已经考虑 
到这点了， 

那么正态扩增法和连续回归间卡方的不同又如何解释呢？作者怀疑这源 
自插补 SAPNK1NG 的多项的 logit 模型没有对该变量强加任何顺序的事实。 
因此，插补值不可能与成比例发生比假设相符。当以一个 SPANKING 的线性 
模型重做连续插补时(将插补值四舍五人到整数),成比例发生比假设的卡方与 
那些在正态数据扩增法下获得的卡方更加一致。二者择其一，作者在先删除所 
有 SPANKING 缺失个案后重做连续插补 8 SPANKING 仍然被指名为类别的， 
亦即当插补其他变量的值时，它被视为一个类别的预测量。而且，成比例发生 
比假设的卡方跟那些由正态数据扩增法产生的卡方相似。 

表 6. 3的最后一栏显示删除 SPANKING 缺失个案后连续回归插补的结合 
结果。有趣的是,两者系数和它们的标准误普遍地更接近于数据扩增法。更进 
一步讲，当我们删除1042个 SPANKING 有缺失数据的个案时，并没有明显的 





I 


信息损失。 

长期的及其他集群数据的 MI 

到目前为止，我们已假设每一个观察值独立于其他观察值，如果数据为每 
个大总体中的简单随机样本，这即为一个合理的假设。然而，许多数据组可能 
在各观察值间有某种相 关性。 例如，假设我们有一个面版个体数据，对他们而 
言，连续五年每年都测量相同的变量。许多分析面版数据的计算机程序需要组 
织数据，将每一年的测量当做个别的观察值。为了将现察值连结在一起，必须 
有一个变置包含识别号码，而识别号码对于来自相同个体的所有观察值都是一 


因此，如果我们有100个连续五年被观察的个体，我们会有500个有效的观 
察值。显而易见，这些观察值不会是独立的。如果已讨论过的多重插补方法被 



偶中任选其一插补缺失数据，那么使用配偶间答案的相关性是很重要的。相同 
的也适用于在同一教室内的学生或同一小区内的受访者。 


—个对于这些数据类别的处理方法是，在一个嵌人观察值间相关性的模型 
下进行多重插补。 Schaf er (1997) 对集群的数据提出了 一 ^多变量线性混合效 
应模型，并且也开发了一个计算机程序 (PAN) 以使用数据扩增法执行插补(参 
见 http,//www. stat psu. edu/-jls/) 0 虽然之前承诺会有一个 Windows 版 
本，但目前仅以 &PLUS 套装软件的一个程序库来运行。 

有一个更简单的方法，当调査的次数相对较少时，对于跟踪数据可以处理 
得很好。基本的想法是要格式化数据，以致对于每一个个体只有一个记录，而 
且在不同时点对同一变量有不同的测量。多重插补接着以我们所考虑过的任 
何一种方法来执行。这就把在任何时点的变量，用来作为任何其他时点的变量 






























扩增法之标准误则 
多重插补并不具有 


几乎都是相同的。 



不可忽略的缺失数据 


前面几章着重讲述了在缺失数据机制可以忽略的情况下能够使用的 方法。 
可忽略性意昧着我们不需要对数据发生缺失的过程进行棋型化。可忽略性重 

点要求数据是随机缺失的-特定变量缺失数据的概率不取决于该变量的 

值(扣除分析中其他变量的作用之后)。 

处理可忽略的缺失数据的基本策略可以简单地总结如下:调整所有缺失和 
非缺失数据间的可观察到的差异，并且假设所有剩余的差异为无系统性的。当 
然，这是一个熟悉的 策略。 标准回归模型就被设计来做这个——调整可观察到 
的差异并假设所有未观察到的差异为无系统性的。 

遗憾的是，通常我们有足够的理由怀疑数据不是随机缺失的 。例如 ，常识 
告诉我们，曾被逮捕过的人比不曾被逮捕过的人更不可能报吿他们的逮捕状 
态，有高收人的人可能不会报告他们的收人9在临床药物试验中，变得更差的 
人比那些变得更好的人，更有可能退出临床药物试验。 

在这些情况下应该怎么办呢？有处理不可忽略的缺失数据的模型且想要 
运用它是很自然的。然而，意料之中的是,很少有可用的软件可以估计不可忽 
略的模型(除了一个重要的例外—— Heckman 的选择性误差模型乂其基本问 
题在于，对数据给定一个模型，只有唯 一一 个可忽略缺失数据机制，但有无限多 
不同的不可忽略的缺失数据机制。所以很难编写计算机程序，以处理即使是这 
些可能性的一小部分 # 此外，根据选择的模型，答案可能会变化很大。所以选 
择正确的模型非常重要，而该选择需要对所调査的现象有非常精准及详尽的知 
识 * 更糟糕的是，没有经验方法可以从一个不可忽略的模型(或从一个可忽略 
的棋 型冲分 别出另一个“不可忽略的棋型”。 





也许你不会极端到 说:“ 不要做那个”，但你可能会这么说:“如果你做那个， 
要极端小心。”此外，如果你没有很多统计方面的专业知识，那么请找一个具备 
统计专业知识的合作者 # 本章针对处理不可忽略的缺失数据的一些方法，为大 
家提供一个简短的导论及概要。 

你所儒要明确的第一件亊情是，作者已经介绍过的对于可忽略的缺失数据 
的方法——最大似然和多重插补可即刻适用于处理不可忽略的缺失数据。 
假设选择的模型正确，那么这两个方法有如他们在可忽略的设定下的相同的最 
适 特性。 第：!点要记住的是，任何有关不可忽略的缺失数据的方法应该要伴随 
一个敏感性分析。因为根据假设的模型，结果可能变化很大，故 试验一 貌似有 
理范围的模型并看它们是否产生相间的结果是很重要的。 

两种模型 


不管你选择最大似然还是多重插补，处理不可忽略的缺失数据有两种截然 
不同的 方法: 选择模型和形态混合模型。对一个缺失数据的单一变量解释最为 
容易。令 y 为关注的变量且令 k 为一个虚拟变量，如果 y 被观察到,其值为1， 
如果 Y 缺失，则其值为0。令/(>% 1?) 为这两个变董的联合概率密度函数。选 
择一个模型意味着对 /O% 1?〉选择某些明确的指定。 

可以使用两种不同的方法因子化联合 P. cl fCUttle Rubin, 1987), 在选 
择模型中我们使用 


/(y, R) = pkj? | y)/(Y> 

其中的边际密度，且 IMi?|y) 为给定某 y 值下的 R 的条件式概率， 
用文字表示，如同没有缺失数据一样我们首先对 Y 建立模型。例如，我们可以 
偎设 /(Y) 为有着平均数#和方差的正态分布，且 Pr (RIY) 为 


PKi? = l |y)=|^ r 


i/y>o, 

f/y<o. 


这个模型被确认且可以被 ML 所估计。对应形态混合模型的备选的联合 p. A f 











其中, X f 为自变量(包含一个截距为 1) 的栏向量 
目的是要估计沐如果所有的 Yi 都被观察到了， 

归得到#的 ml 估计值。然而，有些是缺失的 • I上缺失数据的概率被假 



其中 $( •) 是一个标准正态变量的累进分布，除非 w = 0,否则数据不是随机 


最大似然所估计。对于一个有 r 的观察值-其似然为 
PrCJ?< = 1 1 , xi^fiyi |. *i) = [1 —^(ao +cayi +a2J»)]y(^* - 1 ， 
[7.3] 

其中〆 • ）为 一标准正态变 量 的密度函数。对于一个有 Y 缺失的观察值，其似 
然为 

仁 WR =01^, .)/(,1 [7.4] 

方程 7. 4 服从普遍原则，即有缺失数据的观察值，其似然可以通过求所有缺失数 
据可能值的似然之积分而得到。使用标准数值的方法，整个样本的似然值很容 
易被最大化从而作出 估计。 

遗憾的是，这个方法所产生的估计值对于 Y 为正态分布这个假设过度敏 
感。如果 Y 事实上有一个偏的分布，在 Heckman 模型下得到的 ML 估计值会 
严重偏误，或许甚至比从一可忽略的缺失数据模型下所获得的估计值偏误更加 
严重 (Little &• Rubin, 1987) s 

Heckman 也提出一个两步骤估计量，其对正态性的偏离不敏感，本质上更 
加容易计算，因此比 ML 更加受欢迎。然而，该两步骤方法有其自身的 限制。 


简而言之，两步骤如下： 




R 的 probit 回归于 J 
寒，估计 一HR 小二! 


个转换来自 probit 回归中 f 
不像 ML 方法，如果没 


i ML 方法，如果没有X变量，则两步骤程序不可行„此外，如果X变量 


在 proibt 和线性回归中都相同，参数只能被勉强地确定。为了得到合理稳定的 
估计值，在 Piobit 回归中的X变童必须从线性模型中排除。当然，能够令人信 
服地证明诸如此类的排除限制是很罕见的。甚至当所有条件都符合时,两步骤 

估计量在真实情况下也有可能表现得比较拙劣 （Stokenberg & Relies, 1990, 

1997). 

在这些样本选择方法对于偎设的违反有明显敏感性的前提下，我们应该如 
何继续做一个敏感性分析呢？对于 ML 估计量，关键在于假设为因变量 Y 的正 
态性。所以一个自然的方法是拟和假设不同分布的不同模型。偏的分布，如 


Weibull 或牌 
为重要。虽 
积分法，但是对于其他备选分布， MI 
关键假设是从预澜的线性回归中排隹 


to —个敏感性分析可能探索 


对两个方程选择不 R 

形态混合模型的 


:同组X变量的结果。 







/CX, Y, R) = /<y, X| i?)Pr(R) 


为了使模型更加明确，我们可以僚设 Pr(J?) 由灼，为，灼和/>4该组值 
确定。接着，我们可以假设 /(y，xi jo 为一个有着通常 参数埒 ，件，《，< 


不同的。问題是，当X被观察到而 Y 没有被观察到时，没有倌息可以估计 Y 的 
平均数和标准差或 x 和 Y 的协方差。同样地，当 Y 被观察到而X没有被观察 
到时，没有信息可以估计X的平均数和标准差或X和 y 的协方差。如果两个 
变量都缺失，我们就没有任何倌息。 

为了继续下去，我们必须强加一些限制在这4组参数上。 令胛 为形态 i 的 
参数组。一个简单但非常有限制的条件是， 假设糾 =妒> =卿=岬，其相 
当于 MCAR。 既然那样，形态混合模型的 ML 估计等同于第3章讨论过的、有 
可忽略的缺失数据的、正态模型的 ML 估计， Uttle(1993, 1994) 提出了对其他 
不对应但可忽略的缺失数据产生确认的模型的限制种类。这里有一个例子。 
令艘 IX) 代表在 Y 为形态 i 下，1的条件式概率。 Little 称之为完全个案缺失变 
量 限制： 

- 絡=褴， 

渗《 =於1> 

对于两个具一个缺失变量的形态，在给定该观察到的变量下，该缺失变董的条 
件式概率等同于完整个案形态相对应的分布。对于有两个变•缺失的形态，所 
有参数被假设与在完整个案形态中的那些参数相同。这个模型被确认并可以 
以非迭代的方法得到 ML 估计值。一旦所有这些参数都能获得，就可以很容易 






的是组合形态混合模型与多重插补 (Rubin， 1987〉。最简单的策略是，首先在一 
个可忽略的棋型下产生插补，接着以比如说一个线性来转换修正插补值。之后 
就可以很容易通过在线性转换中用不同的常数重复寧过程来获得一个敏感性 
分析。 

这里有一个简单的例子。再一次假设我们有两个变量X和 Y, 伹只有两种 


缺失数据形态: (1) 完整个案， (2)Y 缺失 a 我们假设在每一种形态内，X和 Y 有 
一个二变量正态分布。我们也相信有缺失的个案倾向于有较离的 y 值，所以我 
们假设对两种形态所有参数都是相同的，除了 其中 c 为某个大于 
1的常数。多重插补接着产生在一个可忽略的缺失数据机制下的 y 的插补值， 
然后将所有插补值乘以。当然，要保证正常运行,我们要选一个 c 值，且该选择 
可以是随心所欲的《敏感性分析由对于数个不同 C 值，重插补数据及重估计模 
型所组成。 M 

现在，让我们将这个变成一个实际的 例子。 对于大专院校数据，有98所大 
专院校在因变量 GRADRAT 上有缺失 数据。 假设那些没有报告毕业率的大专 
院校，相对于那些有报吿毕业率的大专院校，有较低的毕业率，是貌似合 理的。 
我们在第5章叙述过的、对多个插补数据的插补毕业率的平均数比没有缺失数 
据的大专皖校的平均毕业率低了约10个百分点这个事实，支持这项假设。然 
而，这个差异完全来源于预测变童的差异，而且这并不构成显示数据不是随机 
缺失的 证据。 


g 回归于数个变 i 

90^ 


0.067 0.069 0.071 0*072 

2.039 2.062 2.077 2. 39& 

12.716 12.542 11.908 12.675 

—a 217 -0.142 —0.116 —a 216 


60% 



然而，假设在缺失及没有缺失个案间，毕业率的差异甚至会 更大。 毫无疑 
问，修正插补毕业率以使它们等于在可忽略性假设下被插补的指明的百分比。 



表 7.1 给出了插补值为原始值100%、 90%. 80%、 TO% 和60%的结果.对每 
一个回归，会产生全新的插补。因此，横跨各栏的变化是由插补过程的随机性 
导 致的。 一般而言，系数是相当稳定的，暗示对可忽略性的偏离对结论不会有 
很大的影响。 STUFAC 系数变化最大，但在所有例子中它在统计上根本不 
显著。 





第 8 章 I 总结与结论 


在处理缺失数据的传统方法中，成列雇除的问題最少。虽然成列删除可能 


会丢弃一大部分的数据，但除非数据不是完全随机缺失的，不然没有理由期望 


有 误差。 此外，其标准误也应该是真实标准误的适当的估计值。更进一步讲， 
如果你估计一个线性回归模型，对于一个自变量有缺失数据且缺失概率取决于 


该变量的值的情况下，成列删除是相当稳定的。如果你估计一个 logistic 回归 
模型,成列删除可以容忍因变惫的非随机缺失或自变量的非随机缺失(但两者 
不能同时出现 )》 

相比之下，所有其他处理缺失数据的传统方法会在标准误估计值中引人误 
差，而且当数据为完全随机缺失时许多传统方法(如虚拟变量调整)仍会产生有 
偏误的参数估计值。所以成列删除是一个较为安全的方法。 

如果在成列删除中必须被丢弃的 数据置 是无法容忍的，则有两种可备选的 
方法一一最大似然法和多重插补。这两种方法假设数据随机缺失，这是一个较 
完全随机缺失更令人欣赏的较弱的 假设。 在颇为普遍的条件下，这些方法产生 


近似反映无偏误的、有效的估计值。它们也产生良好的标准误估计值和检验统 
计量。但不足的是，它们较大多传统方法更难以执行，而且每次执行多元回归， 
它都会带来不同的结果. 

如果目标是要估计一个属于由 LISREL 或相似软件包所估计的模型种类 


的线性模型，则最大似然可能是首选方法。当前至少有4个统计套装软件可以 





量有一多变量正态分 布 # 通过涉及一个从数据值和参数随机抽取的重复回归 
的贝叶斯估计法来完成 插补。 当前有数个可用的套装软件可以完成这个任务。 

其他做较少限制分布假设的多重插补方法目前正在发展中，但它们尚未达 
到理论上或计算上精细的改进水平，从而供正常化普遍使用。 

也可以在数据不是随机缺失的假设下执行最大似然或多重插补，但要得到 
好的结果是很难处理的。这些方法对于缺失机制或有缺失数据的变量之分布 
的假设非常敏感。此外，没有方法检验这些假设。因此，最重要的必要条件是 
良好的关于缺失数据的产生机制的先验知识。且估计不可忽略的棋型皆应伴 
随着一敏感性 分析， 
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触排布线室的数据，即使到今天，这 种分析 仍然不失为〜 _自常 出色的研究。关于这项 
Ifclg,George Homans( 1950) , Ftonald Bhger 和他的同亊(增 75) 利用社会学方法重新进 
&了分析，以使更多人有会了解这项数据。包南 White 和 Mar Gi^novetter 在 
内的社会学家于20世纪吞七十年代对推动理解社会网络、完着社会网络分析方法,亦作 









和棋型。然而，即使在基本概念这部分,新版本也添加了很多重要内容,如讨论网络分奸 
. 的三个主要的潜在假设。而且,这本书还反映了社会网络分析的许多最新进展，例如，更 
多地强调图形及 P* 棋型这样的髙级方法。网络研究人员及学生将会发现，本书为他们 
探究社会网络数据提供了许多极好的指导。 




社会网络分析简介 





败 I 


如图 1. 1所示，在过去30年里，关键词为“社会网络”的社会科学出版物成 
指数增长，且毫无变缓的趋势。类似地，网络研究也迅速被应用到自然现象及 
数学和物理领域中复杂的社会系统中 (Barabfei， 2002 s Newman, 20031 Watts, 
2003) 。网络分析已然成为一种制度化的跨学科的视角，它的基本概念和测量 
方法巳为多个领域的研究人员所熟知，如社会学、人类学、经济学、组织研究、工 
商管理、公共卫生、信息科学、生物学、复杂理论和混沌理论。 

同时，可用于网络分析的计算机软件也相应地快速增长，如 UCINET, 
Pajek, NetMiner, STRUCTURE, MultiNet， 和 StOCNET 等通用程序被广泛 
应用于常规的网络数据分析(详细介绍请参见 Huisman & van Du«n, 2005). 
同时，也出现了许多有特殊用途的程序来处理识别亚群体 (Frank, 2003)、研究 
隐性人群 (Frank & Snijders, 1994)、统计检验 (Tsi^i, 1997) 和计算賦值图中的 
最优连接 (Yang &■ Hexmoor, 2Q04> 等特殊问题 a UCINET 可能是最受欢迎、 



和 W a sserma n (2005〉 介绍的更深人的高级方法打下了一定的基础。 


本书主要应用于教学，针对的读者主要是社会科学领域的研究生和专业人 
士，其中包括社会学、工商管理、人类学、经济学、公共卫生和人力资源等。这本 
书可作为研究生课程的教学参考书，可用于专业学会或暑期研修班的研讨会， 
当然也可用于网络研究的自学。大学高年级学生和研究生如果对社会网络分 
析感兴趣，也可通过阅读本书在社会网络分析技巧和学术志向方面获得更高的 
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起点。很多专业人员在做社会网络研究时会面临许多挑战，例如如何设计一个 
社会网络项目，网络数据收集过程中可能出现的各种细节和问题，以及分析社 



在本书中，我们常常利用实际的社会网络研究问題来解释相关的概念和方 
法，引用的例子包括孩童游戏小组、组织、社区和跨国 集团。 我们尽量避免使用 
复杂的专业术语，而是用简洁的语言来进行精确介绍。本书共包括4个部分。 
第2章介绍有关关系数据和网络的概念，这些概念可应用于一系列的观察单元、 
分析层次和测量类型。本章比较了关系的内涵和构成，区分了自我中心网络和 



价 >Logit 模型 (p* 八隶馬网络和点阵分析。读者如果希望通过分析书中的数 
据，以便学习如何开始进行网络分析，可以在本书作者 Knoke 的主页 http,// 
www.soc. umn. edu/ 〜 knoke/ 上找到书中所有实例的数据集和相应的计算机 
指令的链接,并且可以下栽文件压缩包。 











本章讨论社会网络分析方法的基本概念。我们使用学者普遍使用的术语 • 
和定义，伹在#有分歧的情况下，遵从社会学惯例。我们在解释这些基本概念 
的同时，说明这些概念的文献出处。感兴趣的读者可以通过这些文献，更好地 


来分析，这些解释仅仅主要考虑了个人特性，而忽略了社会行为人所嵌入的更 
广泛的互动背景，与此不同的是，网络分析法明确假定，行为人参与到社会系 
统之中，而这个系统将他们与其他行为人联系在一起;行为人之间的关系对各 
自的行为存在着重要影响。网络分析理论和方法的关鍵，是识别、测 fl: 和检验 


自的行为存在着重要影响。网络分析理论和方法的关键，是识别、测置和检验 
关于行为人之间关系的结构形式和实质内涵的假设。这种对结构 一关系 研究的 
独特重心，将社会网络分析法与迄今依然主宰大部分社会科学的以变量为中心 
的个体分析的传统区分开来。 


网络分析的视角强调I 
成是“有形实体之间关系模 
也不是对这些有形实体& 




1976:733—734)。 实体可以是单个的自然人，小的群体，组织，甚至是国家。通 
常连接这一系列实体的关系模式包括宏观的社会背景或者整体的绾构，这些背 
景和结构影《他们的认知、信念、决定和行动。网络分析的首要目标是精确测 
量和展现这些结构关系，并解释他们发生的原因及产生的结果。 

社会网络分析的重要性依赖于有关关系模式及其效用的三个基本假设 • 
首先，对于理解所观察的行为，结构性关系要比年龄、性别、价值和意识形态等 
个体特征更为重要。例如，在解释15世纪的佛罗伦萨哪些精英家族支持美第奇 
(Medici) 或寡头政洽集团的统治时，更多地依赖这些统治精英之间的经济、赞助 
和婚姻关系，而较少依赖他们的阶级和社会地位等个人特征 （Padgett &• 
Ansell, 1993)。在实体参与的不同社会情境中，他们的许多特征保持不变(如 
不论在家、在工作场所还是在教堂，一个人的性别、种族和教育程度都是不变 
的)。但是，具体的结构关系仅存于特定的时空> 当情塊发生变化时，这种特定 
的结构关系将消失或暂时中止(例如，学校之外就不存在老师和学生之间的关 
系;当一个人丧偶或离婚时，婚姻关系将不存在)。一个在办公室做勤杂工的女 
性,在工作场所可能不需要什么主动性，但她却可能是邻居关系协会中强有力 
的领导者，或者是个敢作敢为的 PTA® 成员„这种行为差异很难用性别、年龄 
和社会地位等不变的特征来解释》但是，当意识到人与人之间的结构关系可以 
随着社会情境的改变而变化时，这种差异就很好理解了。这种结构关系的分析 
方法备受网络分析者的欢迎;而与之形成鲜明对比的是诸多的互争髙低的实体 
论方法，这些方法将静态的“亊物一概念”作为自己的主要分析单元，包括《本 
质、自我行为、基于规范的一致、理性选择、以变量为中心和社会认同途径等等 
(Emirbayer, 1997). 网络分析认为，除了个体特征，社会实体间的巳具有模式 
的关系也影晌社会 实体。 根据这样的推测,网络分析宜称，可以为分析社会行 
为的原因提供更加全面的理论和实证解释， 

第二，社会网络通过实体之间的关系所建立的各种结构机制彩响实体的观 
念、信仰和 行动。 直接关系和更密集的互动关系使得实体获得更好的信息、更 


① BP 家长一教师关系协会.一_者注 




构提供了各种 s 
配置上的不间， 


多的认知、更强的敏感性，以影响他人或受他人的影响。间接关系通过媒介(例 
如常见的经纪人，他们为客户牵线)也会激发新想法，或获得一些潜在的有用资 
源，而这些资源可能需要通过与他人交易才能获得。例如，相对于较弱、较疏远 
的社会关系，求职人员一般很难通过更密切的社会关系获得有价值的倌息，因 
为关系更亲近的人已经共享或传播了相同的信息 (Granovetter，1973). 关系结 
”各种复杂路径以协助或阻止人群中知识、流言蜚语的传播。社会结构 
5不同，解释了芬兰有机耕作的普及 (Nyblom, Borgatti, Roslakka & 
Sale, 2003〉和美国城市中性传染疾病的传播 (Jdly, Muth, Wylie & Potteral, 
2001〉。个人的身心健康相当大程度上依赖于社会支持网络——比如，当你沮 
丧的时候，是否有人给你送上一份心灵鸡汤 (Cohen et al. , 1998)。结构关系对 
维持团体的凝聚力和团结至关重要，但也可能强化对外部群体的偏见和冲5 
竞争与合作关系有效实现了跨国公司内部有计划的组织变迁 (Tenkasi & Ch 
more, 2003〉、社会运动中集体行动的动员 (Diani McAdam, 2003), 以及从事 

贩毒、非法移民、走私和恐怖活动等“黑色网络”的运转 （Raab & Milward, 
2003) 。通过把信息和资源传递到特定的结构位置，网络有助于激发兴趣、分享 
认同、促进共同的价值和规范。网络分析者试图揭示社会关系如何影响社会实 
体的理论机制，并发掘出特定机制在具体情塊中运行可能需要的条件。 

网络分析的第三个潜在假设是应将结构关系视为动态过程。这个假设认 
识到网络不是静态结构,而是通过个人、群体或组织等实体内部的互动不断改 
变的。当这些实体利用有关网络的知识获取优势时，他们或有意或无意地改变 
了他们所处的关系结构。例如，在 Kenis 和 Knoke(2002) 有关组织领域网络变 
迁的理论中，就认为先前的沟通结构会影响后续的战略联盟抉择。相应地，这 


,和冲突。 
&.Ches- 


些组织间的关I 
束。 这些动态 
(Coleman, 198 


S 些动态过程验证了社会行动理论中更为普適的“从微观到宏观的问題” 
n, 1986). 关键问題是大规模的系统性变化如何从个人的综合偏好和 
目的性行动中显露出来*由于网络分析同时涵盖实体和结构，因此它为微观层 
面选择的变化和宏观层面结构的变迁之间的连接提供了有效的分析概念和方 
法. 不幸的是，跨层动态过程的实证网络分析仍只是一个理想的目标，并没有 














会行为的不同概念方法，但是它们不能视为互斥的选择。相反，许多行为人的 
特征可以重新概念化为两个行为人之间的关系。因此，虽然一国每年的进出口 
額是这个国家经济的特征，但所有的任何两个国家间交易的商品和服务量却可 
以表示全球经济的交易网络结构 4 一个槔球队的总输贏纪录显示这个球队的 
表现，但每两个队的输贏比例可能揭示一个联盟权利结构的细撖差别。朋友的 
数量显示了一个小孩的受欢迎程度(人气)，但分析每一对朋友关系的选择就能 
揭示出重要的小团体和群体。关系反映出复杂社会系统中仅靠成员特征的求 
和或均值所不能描述的新维度。结构关系能影响个人行为和系统表现，且这些 
行为和表现不能还原为行为人的特征„例如，与其考虑行为人的教育、年龄、社 
会阶层、性别和种族，不如考虑行为人之间的交流和建议关系结构，这样能更好 
地解释技术创新的传播比例和模式 (Cowan & Jonard, 2004, Yalente, 1995)。 
类似地，和推測群体的易受感染性和抵抗力特征相比，熟知群体间的亲密关系 
结构更有利于防止像禽流感和艾滋病等传染性疾病的流行爆发 (Jolly et al. ， 
2001)。在此，一个非常重要的推论是:仅仅分析行为人的特征,会忽略社会行 
为的网络视角所提供的许多重要解释。 




多端，既有所有行为人之间没有关联的孤立结构，也有所有行为人之间直接相 
关的饱和结构。一般来说，实际的网络结构处于独立网络结构和饱和网络结构 
之间，其中一些行为人比其他行为人拥有更广的网络。网络分析中的一个核心 
理论间理，便是解释不同结构的发生情况,以及在行为人层面来说明其与其他 
行为人之间关系的变化。在网络研究中，一个同样重要的实际任务是利用关系 
数据，发掘并精确展现这些结构。 

John A. Barnes (1954) 被认为是第一个使用社会网络这一术语的学者。他 
是一个人类学家,曾经研究挪威一个岛上居民之间的关系。 Barnes 将社会互动 
视为“点的集合，其中一些点由线连接”，从而形成关系的“全部网络” (Barnes, 
1954«43)。人际关系的难正式形式构成社会网络整体的一个部分。 Barnes 利 
用了 Jacob Moren 0 (1934) 的成果，后者在展示小孩对同班同学的爱憎关系研究 
中，率先使用了线和标示点的手绘社会关 系图。 本书将在第3聿讨论如何表示 
有关社会网络关系的形象图示和数学矩阵。半个多世纪以来，社会网络这一理 
念和方法巳经从人类学和社会学延伸到诸多学科，并被运用到诸多主流的理论 
和问理研究中^关于社会网络原理缘起及普及的历史性综述，可参见 Freeman 
(2004)，Scott(2000) 及 Knox，Savage 和 Harvey<2006) 的著作 • 

假如社会网络分析仅仅只是推述一群行为人是如何联系的一个概念性框 
架，那么它就不会激起社会研究者如此大的兴趣和努力。作为一套综合的理论 
概念和分析方法，社会网络分析所能提供的不仅仅是精确重述。由于社会网络 
结构影响到个体层次分析和系统层次分析，因此它被认为可以用来解释结构关 
系中的变化及其结果。 J. Clyde Mitch e U(1969:2) 关于社会网络的定义，就特别 
强调了它们对结果的影响 * 他的定义如下:社会网络是“在特定人群中的一整 
套具体的联系;这种联系有一个额外特征,即这些联系作为一个整体可以用来 
解释其中人们的社会 行为' 这一论述在本书的第一版中也得到了 回应: “行为 
人之间的关系结构和个体行为人在网络中的定位，对于每个个体单元和整个系 
统来说，在行为、意识和态度方面都有重要的影响。” （Knofce & Kuklinksi, 
1982: 13) 同样， Barry W e lltnana999:94) 也写到:“在描述社会结构的基本模式， 
在解释这些模式对人们行为和态度的影响上,社会网络分析都能起到作用 






研究设计的基本要素 

对于研究者来说，构成测量和分析框架的社会网络研究设计的三个基本要 
素是:抽样单位，关系的形式和内容，数据分析层次。每一个网络研究项目都必 
须在开始田野工作之前对每个基本要素作出明确界定。这些设计因素的不同 
组合将生成各种不同的社会网络调査，这将都呈现在多个学科的研究文献中。 



杂性大致的升序排列，构成抽样单位的6个基本单元，包括个体、群体(正式和非 
正式)、复杂的正式组织、阶级与阶层、社区，以及民族一国家，一些两阶段的研 
究设计包括一个高层次系统，在此系统中行为人构成其中的低层次实体。这种 
嵌套社会背景的普通例子包括公司与职员、学校与学生、市政机构与公务员、大 
学及其院系与教授等。 

最早且至今仍然流行的社会网络研究项目一般选择小规模的社会背 
录——比如课堂、办公室、工厂、帮会、社交俱乐部、学校、村庄、人为组织的试验 







还必须决定 _ 哪种具体社会关系的 数据。 行为人之间的关系既有形式又有 
内容，这种两分法概念是由 Georg Simm e l(1908) 在分析社会交往时提出的。 
形式和内容这二者在实践中是不可分的，只是为了分析的方便而将二者区分 
开来。内容是指社会交往中人们的兴趣、目的、压力或者动力,而形式则是由 
此而将具体内容转化为社会现实的互动棋式。 Simmel 认为，社会学的任务就 
是发搦确认社会交往有限的几种形式:交际、超越、臣垠、竞争，冲突、合作、统 
—等， 这些交往形式是在广泛的具体环境、社会制度和历史背景下发生的。 
同一种具体形式在内容上可以千塞万别。例如，上级和下级这一基本关系形 

式，可以在政府、军队、商业、宗教、体育运动和文化机构等不同组织中展现。 

相反，不同的内容一比如追逐经济利益和政治权力一电可以通过竞争与 
合作的形式展现 4 

内容与形式这一二分法概念也运用到社会网络分析中。关系形式是行为 
人关系的一征，它独立存在于所有的具体内容之中。有两种基本的关系形 
式： （1) 双方行为人之间互动关系的强度、频率或者力度； （2) 每对成员之间关 
系的指向，即是否为0,或者非对称的，或者双向的选择。关系内容指作为关系 
发生原因的那些亊物 (Burt， 1983:36)。这种实质性内容是由研究者建立的一 
种可分析构造，意在从行为人主体视角获取某一关系的意义。当人们在某一社 
会背聚中被问及“你的亲密朋友、一般朋友和认识的人”时，这一问鹿的内容就 
是指“ 友情' 这一询问的结果得依每一行为人是如何定义这三个词所代表范 
畴的意思而定，另外还得依行为人是如何根据不同人际互动的以往经验来区别 
对方而定。很明显，人们在对友情这一标签及表示亲密或嫌远的行为的理解 
上,可能会有很大差别。 

关系内容或者说连接模式的选择，大部分是由项目的理论焦点和研究目 
标来决定的。因此， 一项关 于保健关系网络的研究就会调査人们有关健康亊 
项信息和建议的来源，而一项关于政治关系网络的研究也许会让他们列出平 
时经常和他们一起讨论或参与政治事务的人。在一些实证问题的研究中，也 
.许不仅仅某一个独特的珂分析关系内容需要调査，而且其他两三种甚至更多 
的连接模式(即复杂关系网络）同时也可能需要进行测量和分析 4 一项关于 








的独立政策信息、政治支持、与他人的倌息互换关系等 (Knoke，Pappi, Broad- 
bent &. Tsujinaka, 1996〉。我们将在第 4 章中利用其中的一些数据来阐述有关 
网络分析的方法， 

虽然在 Simmel 看来，对于将关系内容的细微差别进行概念化和操作化，研 
究者们几乎有着无限的想象力，伹是在这里我们还是提供一个小小的基本内容 
范式： 

⑴交换关系:行为人互换有关实物或象征性物质的控制，比如赠送礼物或 
者买卖商品 • 

(2) 沟通关系:通过行为人之间的联络渠道,双方交换有关信息。 

(3) 交叉关系:行为人在两个或多个社会组织中有成员资格，例如公司董亊 
会成员同时拥有其他身份。 

(4) 利用关系:行为人之间互相联系，是为了获得有价值的物品、服务或者 
信息，比如一份工作、一^政策建议或者一个加人某项社会行动的机会。 

(5) 情感关 系:也 许最常接受调査的社会网络关系就是行为人对他人的感 
动、崇拜、尊敬、厌恶或者敌视等情绪的表达。 

(6) 权力关系 :这类 联系通常发生在正式的科层组织中，表明行为人对于发 
布和遵守命令的权利和义务。 

(7) 亲属关系:这类血缘和婚姻的联系反映家庭角色内的关系。 

社会网络分析对于各种各样的关系内容是如何连接的仍然认识不足，因为 
对于关系内容领域结构的考察仍然研究得 不够。 Ronald Burt(1983) 在关于调 
査对象是如何认识关系内容的研究中，发现在抽样调査北加州人的33个问题 
中，存在实质性的混淆、重复和可替代等情况。他认为，仅仅只需5个关键问_ 
就足以涵盖有关友情、相识、工作、亲属和亲密关系这几种关系内容 
构。然而，对于在各种不同网络环境中普遍使用的关系术语和标签，人们所賦 
予其意义的相似性和差异性，我们还需要更多的研究。一张关于关系内容领域 
间的结构性连接的认知图，可以帮助研究者准确有效地选择最适合理论和实践 
关注点的具体关系内容。 
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数据分析层次在选择了抽样单元、关系的形式和内容之后，研究者对于 
他们在社会网络研究项目中所搜集到的数据，在哪一个层次上进行结构分析， 
有多个可替代性选择。本书第3聿和第4聿会详细论述有关合适的测量和分析 
方法，这里我们将首先概述4种概念独立的分析层次，调査者可能会从中选择 
决定集中分析。 

最简单层次是自我中心网络。这一社会网络由一个行为主体和其他行为 
客体组成，其中行为主体与其他行为客体发生直接联系，而其他行为客体之 















可选择关系的所有可能组合将产生一系列16种独特的三元组类型。在实证网络 
分析中，一 t 基本的描述性问题就是在16种类型中观察到的三元组的分布情况， 
这种综合分布量表也娜为系统计表。三元关系结构的实证研究一般关 
注情感性连接点(比如甚好、友谊、敌视)，并且特别关注三元关系的平衡和传递 
(例如，假如 A 选择 B，B 选择了 C， 那么 A 是否也会倾向于选择 C 呢)。因为本 
书没有足够篇幅来评述兰元网络分析方法，有兴趣的读者可以关注 James 
Davis, Paul Holland 和 Samuel Leinhardt(1979〉 的研究项百 ， 以及 Wassennan 
和 F a ust(1994:556—602) 的全面综述，以获得更加详细的资料。 

除了上述三个微观层次的分析之外，全幅网络是最重要的宏观分析层面。 
研究者利用所有 N 个行为人的每一种关系的信息，对整个网络的结构关系进行 
描述和解释。其中，研究者特别关注在此网络系统中行为人的特定位置成者社 
会角色的展现，以及在这些位置上和位置间行为人联结的模式。虽然一个全辐 
网络有 N 个行为人和 （N2 — JV) 种对偶组合（自我关系一般被忽略〉，但是所有 
这些元素加起来只形成单个系统。 在全幘 网络层面上分析结构变化的原因和 
结果的各种假设，可能需要利用多个不同系统，而且也是相当耗费研究成本的。 
然而，全幅网络分析却广受欢迎，其中一些例子包括对爱尔兰都柏林地区青少 
年朋友关系和伴侣关系的研究 (Kirke, 1996) 、世界各城市间优势等级分层的研 
究 (Smith & Timberlake, 2002)，以及全球信息产业部门战略联盟的研究 


网络分析的这四个层面表明，在某一个层次上涌现的现象，并不能够由其 










3 章 I 数据收集 


对于任何网络实证研究，调査者在开始收集数据之前，必须首先处理三个 
重要的事项:范围界定、网络抽样、关系测量。由于在网络研究项目里，设定行 
为人的边界是一个不言而喻的起点性工作，因此我们就从这点开始讲起。 

范围界定 

关于网络分析的范围界定问题，可以这样简单地设问:在收集社会关系的 
数据时，也许这些社会关系实际上并不存在一个淸晰的界线，那么一个研究者 
在哪里设定边界呢 (Barnes, 1979,414)? Laumann,Marsden 和 Prensky(1983: 
19) 一开始通过对比唯实论与唯名论的定义策略来寻求他们的 答案; 在设定具 
体网络行为人的资格以及确认待分析社会关系的类型上,他们制定具体的涵盖 
规则。但在随后的网络范围界定范式上，他们用三个基本方法取代了上述二分 
法策略:位置、关系和亊件 (Laumann，Marsden &• Prensky, 1989)。本节我们 
将分析这两种处理过程。 

唯实论和唯名论的界定策略在唯实论的界定策略中，网络分析者采纳系 
统行为人自身的主观意向，将范围界定在某一实体组织(例如一个家庭，一个公 
司或者一个社会团体)内的所有或者几乎所有的行为人都可以自觉体验到的限 
度内。 行为人及他们的关系是包含还是排除，得依赖于其他行为人对于相关性 
的判断。例如, Knoke 和即采用这一规则来选择美国能源 
与健康国家政策领域中的核心组织:“一系列重要的行为人旨在参与起草、建议 
或选择有关行动方针(即政策选择)，以期解决当前明确的重要问题。通过确定 






他们之间的相互关联性或者共同目标的实质性定义标准，便得到了一个作为子 
系统的政策领域，有些组织在国家能源和健康政策的制定上，被 圈内人 士认为 
并不具备什么影响力，因此研究者就将他们排除在外。 

在唯名论的界定策略中，为某一特定研究项目的分析或理论目标服务的一 
个概念框架&里被当庳是一个先在的理念，用于界定某一网络边界。在许 
多情形下，法定的或者正式的成员资格要求已经划出了一条明确的界线，比如 
某一课堂上的小学生、某州律协的律师、在联合国具有普遍协商身份的 组织。 
另一个例子是，马克思主义研究者在定义工人阶级时，将其界定为具有共同生 
产关系的所有 雇员。 当然，在何种程度上，主观评价和概念强加这两种界定策 
略恰好会得到相同的边界，这完全是个实践的问题， 

定位策略这种策略利用行为人的特征、他们在某一正式组织内的成员资 
格，或者对某一个清晰界定的位置的占有，来对某一网络进行边界 划定。 Useem 
(1979) 对美国商业精英的研究，便是这一定位策略的范例。他将商业精英界定 
为在1969年的797家美国最大公司的董事会里的成员，并从中选出了 8623个 
样本。 Knoke(2001) 在分析全球侑息产业部门的公司战略联合时，将公司在 
1989年至1998年间 《财富 》500强 、《财 窗》1000强、全球500强的榜单排名作为 
遴选标准。 Feldman~Savelsberg，Ndonko 和 Yang(2005> 调査 Bamil6k6 城6个 
喀麦隆妇女同乡会成员的集体记忆选择时，要求这些妇女都来自同一个村庄或 
者部落。 研究者利用定位策略可能会发现，某一组织的成员名单或者花名册已 
经过时、不完整，或不准确。他们香要自己做普査来编制一个完整的成员名单。 

定位策略一般会得到一个行为人的集合，他们在某一正式组织中拥有相似 
的位置，即使有的人彼此之间并没有直接 关系。 对于使用定位方法掲示的网络 
结构的代表性，研究者应该保持足够的蒈悝。因此，商业稍英间的联系与相对 
低阶位的雇员间的联系是大大不同的 # 跨国公司间形成的战略联盟与小企业 
之间的合伙也是大不相同的 # 伴随定位策略而生的另一个网络问理是，行为人 
之间往往并无联系，或者构成一些小的紧密团体但彼此间缺乏联系。例如，有 
些喀麦隆妇女，虽属同一同乡会，但是通常彼此间却完全陌生 (Feldman-Savels- 
berg , Ndonko &-Yang, 2005). 



在采用定位方法进行网络分析时，研究者应当对涵盖或排除某一特定定位 
标准提出明确合理的理由 （Lamnann et aU 1983j Scott, 1991,58). 研究者可 
以采用唯名论标准，为他们的排除规则设定一个主观性门槛，即使某一定位处 
于持续变化之中。例如，为了研究大公司，研究者也许需要从《财富》榜单中抽 
取50家、100家甚或500家公司。如何设定选择范围，更多地取决于时间和研 
究经费限制，而不是取决于人围公司与未人围公司的某些实质性差别。 Galask- 


明了上述过程。首先，他采用属地原则，即将研究限定在一个地理范围内的人 
口。其次，他根据他的研究时间和经费限度，利用行业标准，排除了商业机构、 
交通业、公用事业、地产业、街道居民组织、社区机构以及小 学等。 

关系策略这一方法依赖于知情者或网络行为人本人提名添加其他行为 
人《关系策略包含几个常用的做法，比如声望法、滚雪球抽样法、固定名单选 
择、扩展性选择以及 K 核心方法。我们将在本小节简要地描述一下这些关系策 
略方法所需的条件及其局限性。 

在声望法中，研究者通常咨询有关资深知情人士或者专家，请他们提名有 
关行为人。例如，调査者调査两个精神健康治疗机构网络，首先统计当地社区精 
神健康治疗机构总名单 (Morrissey, Tausig & Lindsey, 1985〉。接着，他们会询问 
调査对象，请他们从总名单中挑出5个他们认为最重要的，或者他们最经常联系 
的机构。通过这两个步骤，便挑选出了两例核心的精神健康治疗机构。接下 
来，再请关键知情者即人道脤务计划委员会和矫正部门的主任们，从总名单中 
再挑选额外的重要机构，对核心名单进行补充。 

声望法非常依赖关键知情人提供准确全面的信息，因此研究者在确定重要 
知情人士上的能力便非常值得关注 (Scott，1991,59)* Morrissey 等人 (W85: 
35> 就曾经忠告:“在评估声望法划分标准的准确性上，并没有一个统一的准则。 
很显然，不同的划分标准会产生不同的行为人涵釐范围，也会导致随后的分析 
受到影响。”对采用声望法获得的网络关系名单的可靠性和完整性进行评估，是 
一#非常困难的事情 4 经常只有等到一个项目完成之后，才可能对此进行评 
价。因此，网络研究者挑选关键知情人，应当有充分的理论和实践依据，且这些 
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为替代办法，应答驱动抽样设计会要求种子行为主体告知他们的行为客体，如 
果自愿参与项目可以得到一点小小的补偿 • 

在实施网络抽样时，一个程序性问題——是否给知情者提供一个人员名册 
供其选择还是让受访人自己提名——将选择方法分成了两种:固定名单选择法 
和扩展选择法 (Doreian & Woodard, 1992). 在固定名单选择法中，受访人被限 
定于在研究者和知情人士事先所确定的行为人名单中，报吿其社会联系。在扩 
赛照某一名单而是按照自己的意愿确认其他行为 
扩展选择法的运用非常类似于滚雪球抽样法的程序。在 Doreiaii 和 Ww 
92) 的一项关于小孩和未成年人脤务体系项目机构的研究中，任何得以 
涵兼在此网络关系中的服务机构必须满足下面两个条件中的一个:现任机构主 
管至少引用3次，或服务员工至少提名5次。低于上述提名门檻次数的机构将 
被淘汰 出局。 Doreian 和 Woodard 的报吿中指出，固定名单选择和扩展性选择 
得到的网络结果，在几个方面都存在很大差异，其中包括行为人数量、关系节点 


展选择法中，受 
A. 扩展选择 J 
dard(1992) 的- 


、关系点的密度和质量等(关系点的密度是通过将观测到的双向关系点数 
听有可能的关系点数得出来的，关系点的质置是知情人士对关系的满意 
r 延展性及价值的估量)。特别需要指出的是，固定名单法只从总行为人中 
迪50%的行为人,40%的双向关系节点是通过扩展性选择方式发现的。固定 
名单选择方法更傾向于产生非随机性抽样偏差，也就是说，它总是产生一套核 
心行为人名单，而系统性地排除了边缘关系行为人。这个方法会有个不好的结 
t 的关系网络。除非条件可以确保两种方法都得 
3定名单选择法并不能作为扩展选择法的替代方 


度、可3 
选出51 


果，即得到一个没有结构性背录的关! 
到一个相差无几的网络，否则固定名I 
案，即便它有管理成本低的优势》 


最后一种关系策略是 K 核心 法。 Seidman(1983) 提出了 K 核心的概念，用 




宽松。为了实用目的， Doreian 和 WoodarcK 1994) 雎 
立一个更全面的网络边界。相对来说，一个涵兼范I 
偏差方面的质疑，同时研究者随后总是可以运用高 
密的关系网络。然而，一个涵盖范围大的网络 却会令 
虽然低 K 值会使得网络范围更宽，但是研究者在每一 
研究对象，而这是一项花费巨大且容易犯错的 任务。 

网络节点的数量带来指数增长而非线性增长 。虽； 

非常少，但是我们相信，在界定网络边界的实证研究中- 

卜的发展应该便利了 K 核心法的使用. 

这一方法在划定网络边界时，根据发3 
点中的行为参与者而定 (Marsden, 2005, Scott, 1991:60〉。 
WebsteKWM) 在南加州海滩观察休闲人士时，将范围限定在 
天会来海滩的人士。他们共收集了 353个事件的参与人 ，其呼 
光顾海滩的爱好者。基于事件参与的涵盖规则完全不同 
策略法，后两者都忽略了行为人的行为。 

由于基于事件的策略依赖具体的行为或事件来确定 
这类行为进行合理归类就显得非常关键。对于基于事件的分析来兔 
惧的便是为选择能够回答具体研究问题的事件提供充分的理由 - 
3是重要的，或者知情参与者认为是重要 
1 因忽略某些重要的行为和参与人而导 
整数据或者缺失数据。对于依靠一个单独事件来界定网络边界的《 
这个问理尤其敏感，因为许多重要的行为人也许根本就没有参与 
此，对多个事件进行观察，一般来说也许可以获得一 
由于每一个事件都包含着一个潜在的独特的网络小团体，因此同时考察 


k 近网络分析软件的发I 

I于事件的策略 


，立观察者认为是重5 
t 界定方法易于因忽 B 


I定 


件便得到一个可延展的网络 边界: 每一个事件都产生一个独立的网络 






叠。将所有事件的参与者集合起来， 
便得到一个更加广泛的网络，这一网络能够更好地回应研究者的问题。例如， 
为研究大学宿舍里的学生互动情况， Freeman 和 Webster(1994) 对咖啡馆和宿 
舍这两个不同环境中的社交聚会的事件参与者进行了观察。 


单个和多个提名生成法提名生成法常用于自我中心网络关系研究，其通 

过调査问卷从每一个主体受访者那里收集与主体有直接联系的关系客体间的 

相关关系的信息 (Marsdenm，1987). 自我中心网络关系研究者依赖于两种调 

査工具 :提名 生成法和姓名阐释法。提名生成法确定调査对象的关系客体，姓 

名阐释法则获得每一个关系客体自身、关系客体之间的关系，以及； 

体之间的关系的信息 (Marsdenm，2005). 首先，主体受访者被要求1 

量的人名，这些人名与其有某种特别联系。接着受访者会被问及他/她所提供 
的人员之间是否有特别联系。最后，受访者还得提供每一个关系客体的具体特 
征，比如年龄、性别、种族和教育程 度等。 

根据研究目标的不同，自我中心网络研究可选择利用单个或多个提名生成 
法。 单个提名生成法依靠一个调査问题来引出关系客体的名字，1985年美国 


，以及其与关系主 

JE 要求提供一定数 












受访者还要求回答:他们与关系客体认识多长时间了？平均间隔多长时间 
交谈一次？与受访者之间是什么关系（比如配偁、父母、子女、邻居、同事、朋 
友、顾问)？同时他们也要报告每一个客体的性别、种族、教胄背景、年齡、宗 
教和政党认同。 

1985年 GSS 的受访者平均只有 2. 94个可与之讨论重要事情的人，而这些 
核心讨论圓成员的55%是家庭亲属 (Mawdeix, 1987) 0 自我中心网络密度测量 
均值为 0. 61,意昧着多数关系客体相互之间认识(自我中心网络密度测量关系 
主体所感知到的关系宰体间的关系强度，其中0值等于完全陌生,1值等于非常 
紫密， 0. 5值等于其他)。美国人的核心讨论圈在年龄和教育背景方面比一般人 
群更具有同质性。性别多样性均值为 0. 68,意味着在绝大多数核心讨论圈中男 
女性别是比较平衡的 。 相反的是，种族/民族异质性均值为 0. 05,这一低值意昧 
着绝大多数关系客体都是同一种族的， Mar S den(l 9 87) 将这一现象归因于大部 
分的亲厲间提名》 

2004年美国综合社会普査沿用了 1985年 GSS 的提名生成法，但是网络规 
模均值从1985年的 2. 94下降到2004年的 2. 08,这是一个主要的变化 
(Mcpherson, Smith-Lovin &- Brashears, 2006)» 1985年，一个受访者平均有3 
个知心密友，但20年之后却变成了 0,几乎近1/4的受访者无人可与之交流重 


中，而与公益组织和邻居的联系越来越少。受访者与关系客体的同质性持续偏 
髙，伴随着教育背录异质性的下降，种族异质性上升。分析推测，美国人口特征 


J 变化某种程度上可以解释美 


Ruan, Freeman, Dai, Pan 和 Zhang(1997) 利用 GSS 中的单个提名生成法 
于1986年和1993年在中国天津进行了两次调査。在这两次调査中，天津受访 
者普遍提出了更多的核心讨论圈成员（均值分别为 4. 58和 3. 30), 这比美国 
1985年的均值 2. 94髙出许多，而且天津人的核心讨论圈成员中亲厲要更少一 
些。相对于1986年,1993年的天津受访者核心讨论圈中较少提及同亊和亲属， 
但是更多提到朋友。这些变化反映了中国自1978年以来社会宏观结构的变迁， 
其间中国利用更加灵活的市场雇佣制不断替代终身雇佣制。伴随着变迁的持 
续，人们逐渐发展了更多工作圈之外的社会关系，因此导致核心交往圈中其他 
关系人的加人机会的增加 (Ruan et aU 1997). 

1985年 GSS 调査问卷在利用提名生成法时并没有关于所谓“讨论重要事 
情”的内容提示，而是将解释这一术语的任务交给了受 访者。 这种模糊处理可能 
使不同受访者对此有不同解释，从而影响自我中心网络的结构或组成 (Bailey & 


工作或玫治有关事项的受访者则较少提名亲厲成员。为了仔细研究受访者在 
解释“讨论重要事情”时的认知过程， Bailey 和 Marsden(1999) 使用共时有声思 
维摊，对50个受访人进簡査。首先问这些受访者提名生成法使用的标准问 
题，接着立即用各种试探方法研究他们的思维过程。大多数受访者将之解释成 
个人问题，如家庭问题或个人间的问題。虽然先前的调査问題会明显弓I导受访 
者用其他方式解释“重要问题”，但是这些不同的解释并不会形成实质性不 R 的 
网络构成。为了方便将来运用单个提名生成法， Bailey 和 Marsden(1999) 提出 
了 4种可选策略。第一种策略将定义内容与诱导关系客体分开:受访者首先被 
要求根据自己的理解定义重要事情，然后根据其定义来提名客体6第二种策略 
使用举例法来解释重要事情:研究人员提供一些例子，来帮助受访者定义有关 




:心集合，但是它所得到的联系 
研究人员通常会对单个提名 
在一 个关于“朋友”概念 
的概念来描绘完全不同的 
多个提名生成法。这一方 
关工作、业余爱好 
方者处获得数量不 
L5 个名字 • 而且， 

义五花八门，包含 

11个姓名 

穿着 更高密度的自 


6津调査时使用了 
i 项外，她还利用了一些工具性 
比如社交、谈心和寻求建议 4 
姓名，而其余十种提名法总共 
t 要事情，，当成是社交性表达事 
昀物或者游玩)视为他们讨论 
5名单更少被涵盖在核心讨论 


> 网络。 这种提名法要求受访 


Bernard，Shelley 和 McCarty 










也只得到一个网络密度最髙的 J 


Fischer 的北加州调査，利用多个 提;； 

为 18. 5) ，但是其网络密度也最小。 

?间方面的限制， GSS 调 j 
1991) 的研究使人们了解到, 


因为没有设置空间方 


3. 01). 

.获得了一个最大规模的网络(均值 
纳什维尔调査中的关系持续时间;I 
I査中的关系联系频率： 


时间是最长的， 
!率是最离的。 
f 施加的限制条 

I:会结构——由 
金字塔型和分等级的，社会资源及其取得路径 
1，1982, Lin &• Dumin, 1986)。虽然有许多研 
地催化功利性行为的，但是一直以来却很 
3行分析》为了解决如何衡量行为人的社 
之受访者报會其是否在某一社会位置上与 


!和分等级的，社会资源及3 
正是嵌在这种社会结构之中 （Lin， 1982, Lin &• Dumin, 1986)。虽 
究考察了社会关系连接点是如何成功地催化功利性行为的，但是一直以来却很 
少有研究者对取得社会资源的路径进行分析 • 为了解 i 
会资源这一实证问理，位置选择法要求受 i 
他人具有联系。处于社会等级结构中的某个位置是社会资源的一种合理指标， 
在此意义上调査某个位置上的人的个人交往关系不仅可以显示其拥有何种社 
会资源，还可以显示其获得社会资源的途径。 

【置选择法反映社会资源获取途径，主要依赖于社会位置的选 
n in(1986) 从1970年美国普査职业分类指标中选择了 20种频次 
最高的职业。这些职业在白领和蓝领工作领域的上层和下层均有所分布*受 
访者报告其是否在这些职业位置上有任何社会关系，比如亲戚和朋友 (指 有较 


如何通过位置选豆 
私。 Lin 和 Dumin(191 


影响.当受访者出身社会上层时，强的 
业的作用基本平等。但是当受访者出；! 
点能提供更髙社会地位的工作机会* i 
择法用于研究台湾的职业声望与收人 f 
取社会资本方面呈现出性别不平等现 
的职业和高的收入，然而对于女性来 ij 


获取较好的工作和收入。 











个职业的连接关系。社会资源依照职业结构的金字塔型和分等级的不同层级 
进行分配，在此意义上位置选择法所得到的不仅仅是人们获得不同职业的途 


助，而位置选择法却将选择限制在某 

资本宽泛地定义为人们从各种社会尾 


研究人员常1 

所有类型的考 

IJi 均，其中 j 指社会资源顼，马指测算这类资源的可获得性 (Van der ' 


Snijders, 2004). 与位置选 S 
选择法询问人们是否认识可3 
(2004) 询问荷兰 


r 利用某种具体资源 的人。 


f 特定职业有联系不I 
..VanderGaag 和 


ler Gaag & 

不同 ，资源 


和 Snijders 

痛兰的受访者，“请间您是否认识谁可以帮助做……”(有35种选项， 
广)他们报吿说,17个资源选择项目形成了 4个亚 
J 同质性，但可关联性较弱。其中测量获得教区牧 
师这样有声望的职位的亚层次，与 Lin 和 Dumin(1986) 的位置选择法非常相关。 
但是，获取信息和获得工具性支持比如帮助搬家)的2个亚层次与位置选择法相 
关性很弱，因 W 成了独特的社会资本维度。 

测量全部个人网络一些研究人员对测量全部个人网络感兴趣，因而创造出 
多种提名生成法来达到目的。全部个人网络指的是行为主体认识的所有关系， 
依据具体方法，全部个人网络规模可达250个至5000个 (Freeman &• Thomp¬ 
son, 1989, Killworth, Bernard & McCarty, 1984). 

在名单核对法中，研究人员首先随机选出几个姓名（或姓或名）,然后将这 
些姓名读给随机挑选出来的受访者，问他 们:“ 你认识叫这个名字的人么? ”当受 
访者说认识某一个名宇时，访谈者便问他/她有关该人名的倌息 a McCarty, 
Bernard, KUlworth, 沒 lelley 和 Jobnson(1997) 利用一组 50 个名字的名册访谈 
了 793位佛罗里达民众，采用的就是这一方法设计。访谈者请受访者报告与名 
册里名字相同的朋友的联系。研究要求受访者通过外貌或名字知道对方，并且 


他们在最近两年里有过 联系。 McCarty 等人 (1997) 通过这种办法获得了最多 
14个关系客体的一个名单，但发现这个名单样本中黑人、西班牙裔和亚裔的代 











’Killworth 等人 (1990>才 
他们发现，佛罗里达人的个. 
吾民的平均值是600人， 
金不同方法中的重合部分。 


>将1^、名单核对法和 GSSS 
t* 人全部网络关系规模平均是 
对用同样的数据资源， Bernard I 
t 现 GSSi 


提名生成法综 
1700人，而墨 
等人 (1990) 调 
提名生成法和多重社会资源 




以及美国专利商标局等，存储了大量有关公司董事会、战略合作伙伴、小企业主 
以及专利摘报等信息，极大地方便了研究人员对商业组织网络的研究。 

档案资料检索新技术的出现总是层出不穷。利用因特网这一巨大丰富的 
个人信息库， Adamic 和 Adar(2003) 设计了一种技术，用来发掘其中的人际关系 
网络。他们用一种客户堆软件，调査两个大学(斯坦福和麻省理工)服务器上个 
人网站的网页内容。他们关注每一个主页的文本、外部链接、内部链接和邮件 
名单。他们这种发掘因特网内容的创新尝试，不但了解到谁认识网站主人这类 
倌息，而且还了解到他们的认识是在何种社会情塊中发生的。例如，麻省理工 
的学生傾向于通过大学生联谊会及其下属组织来互相认识，其中提名最多的… 
个社交场合有5个是大学生联系会之类的组织。比较而言，斯坦福的学生之间 
的认识渠道更加多样化，比如通过研究团体、宗教组织、文化交流机构以及学生 













0. 一个例外是 Baker 5 


!国参议 
交了非法 


商业关系网络的结构及其动因。 

自20世纪90年代以来，随着电脑网络技术的迅速应用，电子化交流不再 


络使用者的交流，从而让研究人员便于研究它、揭示它的模式。社会网络研 
究者通过检视这些电子化交流 (CMC) 系统，比如电子邮件、电子公吿栏、语音 
信息和其他交友软件，获得了丰富的社会网络数据 (Rice， mo , 1994, Rice, 



行快速搜索，极大方便了基于内容的研究。 


与自填式问卷调査相比 .CMC 分析方法的强制性较弱，且具有更小的测量 
误差》例如，当两个人自填的关系不一致时，要发现这些测算错误的来源，比如 
回忆不准确、回笞有偏、问卷用词问题等，就变得几乎不可能了 （Rice, 1994 s 
176). 然而，计算机控制网络数据能够精确地反映 CMC 信息的内容，因此有关 
相互关系的假定就能够得到明确的区分和验证。虽然 CMC 数据比自填式问卷 
得来的数据更精确，但他们并不一定更 有效。 他们通常展现人类交流的不同方 
面 (Riceet at ，1989)，例如，电子邮件交流能更准确反映工作行为而非朋友间 
和家庭成员间的社交行为。作为使用工作服务器电子邮件系统协议的一部分， 











雇员普遍都签署了协议同意自愿分享他们的交流。因此，依据研究主題的不 
同,研究者应当对 CMC 系统产生的数据保持警醒。对某一^•司脤务器用户的电 
子邮件交流进行监控检査，可以获得关于工作联系结构的丰富数据，但是却很难 
获得雇员业余时间的关系结构数据 • 单独依赖 CMC 系统也可能会错失一些非常 
重要的细微交流之处。大量信息内容是不重要的例行公事，偶尔会有一条非常重 
要的信息，忽略这样的信息也许会产生严重后果。因此，研究者应当对 CMC 数据 
分析保持瞀惕，因为这种方法虽然揭示了有价值的背景线索，但同时也丢掉了一 
些交流行为中的重要的东西 (Rice，1994,177). 

CMC 技术的最新发展大大延伸了网络的运用，便利了社会网络分析 
(Berman & Brady, 2005)。网络基础设施包括诸多网络工 具:比 如高性能计算 
机和网络，个人电子设备(即时信息工具、黑莓手机和个人数字化助手)，数据获 
取、管理和分析脤务，可视化设施等。网络基础设施为社会网络分析提供了大 
量新的机会。例如,离性能计箅机服务器记录万维网和个人电子设备使用者的 
文本信息。对这些文本信息进行分析会得到重要的社会交往模式和网络构造。 
大量的机会同时也带来巨大的挑战，从如何获取、存储、分析海量数据这些技术 
问題，到如何确保获得知情同意权以及保护隐私等法律和社会的问题。因此， 
网络基础设施所支持的社会网络分析，要求多学科之间进行前所未有的合作， 
包括社会科学、法学、电子学和计算机科学等。 

Adamic 和 Ada r (2003) 利用网络工具获取和分析巨貴数据的研究就是一个 
很好的范例。这些数据信息在网络空间流转，通过对它们的分析，深化了我们 
对社会网络中某些重要亊件的理解。为了研究小世界现象，他们从惠眘公司实 
验室员工的电子邮件和超过2000名斯坦福大学学生的社交网页中，收集了大 
量信息。这个交流网络包含流通在430个人之间的4000封电子邮件。这些人 
在3个月的观察期内，每人至少交换过6封电子 邮件。 网页网络数据来源于 
一个社群网址 Club Nexus ，它邀请斯坦福大学学生加人该俱乐部并且登记他 
们的朋友圈。登记过程中也要求登记人报告他们的专业、性别、个人特征、宿 
舍地址、爱好等。朋友也被请求回应登记在 Club Nexus 的关系。未得到回应 
的关系将从数据库中删除。为了定位交流目标, Adamic 和 Adar 对被观察电 





相关度寻找法选择那些通过认识很多人来了解研究对象的个人。第二种便是 
将信息传递给在组织等级架构层级中离研究对象最近的联 系人。 第三种便是 
将信息传递给在空间距离上离研究对象最近的联系人。在两种网络中模拟这 
三种策略后， Adamic 和 Adar 认为第二种一位置搜索发现了实验室网络中 
关系双方的最短路径 # 然而，没有任何一种搜索方法得到了俱乐部网络的最 
短的合理路径- 

认知社会结构 

虽然关于社会网络最普通的问题之一可能是:“谁认识谁? ”但是，与认知 
社会结构 (CSS) 分析最相关的问題也许是:“谁知道谁认识谁? ”研究者使用 
CSS 数据调査知情人对于网络关系的认知的变化。虽然知情人可能是外在的 
观察者，但是他们也是其所报吿的网络的参与者。为了创建一个 CSS 数据 



知性存在 # 对于某一个具有 N 个行为人的网络，一类关系的完整 CSS 数据库 
含有 N 个认知图，这些认知图标明了毎一个参与者一知情者视角下关系连接 
点的显现与 缺失。 鉴于可能需要大量的时间和回忆的负担——每一个知情人 
需对具体的有向对偶关系进行次判断， CSS 数据收集工作常常限于非 
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信息偏差 

我们将信息偏差定义为自我报告的行为与真实行为之间的不一致，对于 
言词和行为之间的鸿沟，社会科学家早己开始进行观察。在20世纪30年代 
早期， Richard LaPierre 和一对年轻的中国夫妇开车横穿美国，途中他们在1 84 
家餐馆吃过饭，在66家旅馆住过宿，并且只被一家旅馆拒 绝过。 旅程结束后， 
LaPieire 给所有的餐馆和旅馆等发信，问他们是否“接待过中国人”。结果， 
92%的回复是“否” (UPierre，1934). 拉皮尔因此总结,偏见态度的行为表现 










是需要支撑条件的。在另一项研究中， Kronenfeld(l 9 72) 询问刚离开餐厅的 
人，男侍者穿着什么样的瓶装？餐厅又播放什么音乐？许多受访者对服装和 
音乐提供了详尽的信息，但实际上这几家餐厅根本就没有侍者或没有播放过 
音乐。 

信息偏差的来源多种多样*许多受访人对于准确报吿他们自己行为的要 
求，并不具备处理这种大量信息的认知能力 （Bernard，Killworth, SaUer 
Kronenfeld, 1984〉。另外还有两个方面的尿因:知情人在认知上将某一种归类 
形式强加至某一不归类的附属模型上 (Freeman, 1992) »知情人矫正他们的认知 
以便维持亲密朋友间的平衡关系 (Krackhardt & Kilduff, 1999). —些研究人 
员认为，信息偏差并非随机的噪声，恰恰某些受访知情人在准确提供行为信息 
上的确要比其他一些 人强。 例如，一些研究表明，对受访主題的熟悉往往会有 
助于受访者对事件的回忆 （Romney & Weller, 1984, Romney, Weller & 
Batchelder, 1986). 相反，另一项研究发现，虽然对论题知识渊博的受访者遗忘 
较少，但他们也容易同时创造出一些诸如并不存在的关系成员之类的错误 
(Freeman, Romney & Freeman, 1987)。还有分析发现，所有的受访知情人士 
都倾向于将自己视为更加靠近网络关系的中心，而并非如其他网络成员所报吿 
的那样。因此，对某一网络组别层面的报告也许要比个人层面的报告来得更准 
确些 (Kumbasaretal, 1994) a 最近几项关于自我中心网络的研究都对信息偏 
差问题进行了考量（例如： Brewer， 2000； Feld & Carter, 2002; Johnson 
Orbach, 2002, White & Watkins, 2000). 

对于将自填式问卷得到的数据作为网络关系人的真实行为数据进行研究 
的社会网络研究者来说，也许最引人注目的消息就是 H. Russell Bernard 和他 
的同亊们所进行的項目 （Bernard Killworth, 1977, Bernard, Killwoth &. 
Sailer，1981, Bernard et al., 1984). 他们构建并比较了 7 套配对的交流网络 
数据库:由参与人自述建构的认知数据;由机器监控系统或“客观”观察者记录 
所建构的行为数据.这些数据库系统包括:两组华盛顿特区的聋人 TTYC 文本 
电话系统，专为听力或语言不便者使用)使用者;弗吉尼亚、宾夕法尼亚和俄亥 
俄无线电协会的业余使用者》社会科学研究所的职员》西弗吉尼亚大学技术教 






育的一个研究生项目;大学学生联谊会驻地 } 一组电子倌息交换系统 (EIES) 使 
用者。例如, EIES 使用者记录自述数据(认知网络)和通过 EIES 电子监控系统 
所得数据(行为数据)。所有7组双方交流网络数据包括:“受访人与谁联系交 
流? ”“他们多长时间联系一次?”“他们联系多长时间了?”通过对这些认知数据 
和行为数据进行比较， Bernard 等人 (1981:17) 发现大约一半的自我报告知情人 
在某些方面是存在问题的，并得出如下结论 ： 

如果对其要求任何可接受的精确度，人们实际上并不能够说出他们在过去 
特定的一段时间内与谁交谈过……我们现在确信，关于交流的认知数据并不能 
够代表同等行为的数据。 

其他一些学者认为,情况也并非像 Bernard 和他的小组所推述的那样亳无 
希望 a Knoke 和 Kukli nS ki(1982:32) 对‘ ‘客观”观察者的准确性和中立性表示怀 
疑。他们提出如下一些问埋，“在什么程度上这些中立的观察者打扰了正在进 
行的行为? ”“他能够多精确地记录双方的交流? ”“在非观察期他们之间的交淹 

如何?” Bernard 等人 (1984) 后来调整了他们的例子，承认尽管在认知数据方面 

存在一些系统性扭曲，但通过一些改进因素可以减少信息偏差，比如让知情人 

更熟悉文化背景，或由访谈者给受访者提供相关回忆提示和帮肋。他们建议 

“信息的不准确性不应该导致抱怨或绝望，而应该引至一个尚未开矗的研究新 

领域” (Bernard et al ， 1984,513). 

信息偏差常常以其他系统形式发生。持偏差观点的受访者将自己视为更 
趋网络中心 (Kumbasar et aL ， 1994), 而忘却边缘行为人,错误地回忆主要网络 
« (Freeman et al , 1987) ,在认知上矫正他们的认识以达成他们与或近或远 
的朋友间网络关系的平衡 (Krackhardt & Kilduff, 1999)。信息偏差也往往由 
不准确的回顾所致 (Bernard et aL ，1981, Bernard et aL , 1984)。 不能准确回 
忆的知情者容易犯两类错误 :（1) 忘记他们与谁交往过》(2> 错误地回忆实际上 
从未发生的事 (Freeman «吐，1987)。而且，遗忘和错误回忆并不是随机发生 
的，知情人倾向于遗忘并不频繁的参与者，错误回忆频繁的参与者。 Freeman 
等人 (1987) 记录了参加9个座谈会的大学教师和学生。最后两个会议结朿后5 
天,研究者调査了 17位参加过这两次会议的知情人和16位没有参加这两次会 








议但是参加了至少两次之前会议的知情人。研究人员问他们参加和缺席会议 
的情况。这些知情人在272个选择机会 （ 17 X 16 = 272 ) 中犯了 141个错误 
(115 个遗忘和26个错误回忆)。52%的错误率非常接近 Bernard 等人 (1981) 的 
估算。 Bernard 等人估计过半的知情人自我报告是不准确的。座谈会知情人在 
对其他参与人的了解上，差异较大，而这就影响到他们的错误率 (Freeman et 
al ，1987：312) 0 与知之甚少的知情人(他们只在座谈会中与其他人交流过)相 
比，知识丰窗的知情人(他们对其他人在许多方面都有所了解〉更少遗忘，但更 
多地犯回顾性错误。因此，与通常的认识相反，知识丰富的人实际上更容易错 
误回忆。然而，这些知识丰富容易错误回忆的人却是会议的经常参与者。由于 
社会研究的主要关注点是如何测量各种重复行为的模式，因此就收集这些数据 
而言，这些知识丰富的人倒是很好的知情人 (Freeman et a L ， 1987). 

知情人之间的离度一致常常童味着低误差和高信息效度。因此， Romney 
等人 (1986) 提出一个共识模型，将知情人的能力（指知锖人了解研究客体的 
程度)和知情的统一性、有效性联系起来。一个核心观点是:任何两个知情人 
答案之间的一致性，是每一个答案与真相相关联程度的函数。也就是说，相 
对于无效的回应,有效的回应更容易经常得到同样的答案。研究者要求知情 
人回应一系列问題，而对于这些问理只有研究者本人才有标准答案。他们用 

所答正确数除以答案总数的比例来评价每一个知情人答案的“真实”有效性 

水平，用共识模型来评价其一致性有效水平。他们发现知情人的真实性准确 
度与他们的一致性准确度高度相关，因此他们也认为一致性的答案往往等间 
于有效的答案。 

总之，与 Bernard 等人 (1981) 宣称的知情人自我报告总是错误地反映事实 
真相这一结论相反，对信息偏差的研究为如何更合理利用知情人提供了有益的 
建议。知识丰富的知情人能提供有关长期重复模式的无偏数据，同时他们也能 
够提供一致的答案，而这正意味着更高的有效性。个体认知相比于系统对所有 
网络行为人的综合认知而言，更偏向于将自己视为网络的中心 • 因此，系统认 
知要比个体认知更能准确把捱一个人在网络中的定位。另外，自我往往会通过 
“平衡计划”对亲密朋友和较疏远的联系人产生认知偏差。那些利用自我中心 





从一般意义上来讲，信度是指特定工具用于重复测量同一事物时，每次都 
得到同样结果的一种程度。其中，有好几种薄量信度的方法，包括观察者间信 
度、翻法信度、内在一致性信度(包含折半信度和 Cronbach a 信度 XNeuman, 
2000:178-185). 社会网络研究者常常使用再测法来判断知情人的信度。例 
如，对知情人提出或剔除讨论重要问题的联系人名册，再测法会在以后的某一 
时间再次就同一问題调査该知情人。比较前后两次反应的一致性程度，即可得 
知每 —个知 情人的信度。当两次调査中知情人都提供了完全相同的核心讨论 
圈名单时，即这两次测量能够完美对应时，就表示完全可信 • 相反，在一个完全 
不对应的测量中，知情人选择了与上次完全不同的名单，那就意味着完全不可 
信。在操作再测法时，一个关键的问龎是两次测量之间的间隔。两次测量之间 
的不同答案，也许反映的是个人网络关系的真实变化 • 实际上，人们不停地发 
展新的人际关系，他们之间可以进行表达性的或实质性的帮助，比如讨论重要 
问题、搬家、照看小孩或者借钱等。方法论者认为，这种颠覆性问题可以通过缩 
短两次测量之间的间隔来减弱其影响 (Brewer, 2000)。间隔时间越短，个人网 
络产生的实际变化可能就越小，因此这些变化对倌度测量产生扰乱的可能性也 
就越小。 

—个简单的但经常使用到的再测法信度测量是 Jaccard 系数，它指排除共 
同负面配对之后的同意 部分。 它是这样计算的:用知情人两次测量都提名的人 
数，除以两次澜量中提名的总数① (Brewer，2000). Jaccard 系数值从 0. 00至 
1. 00,表示零可信度和完全可信度。下面是一个含有35个姓名的虚拟名单，结 
果显示在交叉表中，单元频率按照 A-D 来表示。 







12/(12+5+3)-0.60. —个小组中的每一个知情人可能具有不同的信度，因此 
一个小组级别的 Jaccard 系数便是所有个人系数的均值或中位数。 

iey & Weller, 1984). 假如知情人 
;行为，那么知情人之间的一致性 
就往往能够表明知情人回忆的有效性水平。例如，针对网球比赛的问题，网球 
运动员应当比非网球运动员表现出更多的一致性。知识丰富的运动员也许能 
够完全一致地回答这些问題，而没有相关知识的运动员则会给出五花八门的答 
案。从这个中心观点出发， Romney 和 Weller(1984) 再次分析了 Bernard 等人 
的数据库，用于确认那些有效可信的“好的”知情人，和那些无效不可倌的“差 
的”知情人。他们发现，个人的信度与他/她的效度是正相关的。个人的信度通 
过个人回顾与组别整体回颊之间的相互关系来测量，效度则根据个人回頋与组 
别整体数据的一致程度来计算。另外，离信度的人比低倌度的人更倾向于与其 
自我报吿有更离的相关性。因此，主要的发现是，可以通过信度预测效度，具有 

高效度的知情人之间应该要比低信度的知情人之间，具有更多的相似反应而 

且,知情人应当由他们的信度来加权:那些具有更高信度知情人的答案应 

那些低信度知情人的答案賦予更高的权重。仅就高信度人群这点来说，I 
等人的数据中的知情人提供了有效的自我报吿，这从他们的回忆数据习 
察互动数据的高度一致性能看出来 (Romney & Weller, 1984,75). 

在一定程度上，知情者中忘却某些联系是不可避免的。因此，相对于 
自由回忆法，可以采取某些帮助回忆措施——比如提供线索或提示的名单 
它们的可靠性问埋更少。比较自由回忆法是指知情人在没有任何帮助的 
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下进行提名。例如, Jones 和 Fisch e r(1978) 对某种具体网络关系，比如“借钱' 
“讨论工作有关的事务”，访谈了 86个人。第一轮访谈中，受访者自由地回忆那 
些关系中的个人*第二轮，研究人员给每位受访者一个名单，并且重复了同样 
的问题。结果第二轮比第一锋多得到34%的人员名单，而且第一轮提名的27% 
在第二轮访谈中并没有被提及。 

在另一项网络信度研究中， Brewer 和 Webster(1999) 调査了 217位住在一 
个大学宿舍楼中的人员。第一轮调査要求他们写下居住在这栋大楼的所有朋 
友的姓名。第二轮則为每个受访人提供了住在本楼的人员花名册，然后请受访 
人再次确认他们认识的朋友。利用花名册的提示,聋访者平均多提出了 20%的 
朋友名单。而先前忘记的名宇，多是关系比较疏远的人,这也表明如果没有提 

示和线索，受访着一般会遗忘与他们关系相对疏远的对象。其中一个推论是， 

当一个研究人员将在两次独立的访谈中获得的自由回忆数据和基于帮助而得 

到的数据进行比较时，会出现结果非常不可信的情形 # 在这种情况下，低信度 

只意味着更高的效度:知情人在一个访谈中比在另一个访谈中得到更完整的提 

名。当然，倌度并不保证 效度。 一个知情人在两次访谈中也许提名完全相闻， 
因此获得完美的信度，然而每轮访谈都可能因同时忽略了同样的名字而产生了 
同样的偏差。不过，高效度的网络反应一般来说具有高信度。也就是说，假如 
一个受访者能够总是根据某一提名法则列举同样的朋友名单，那么这个受访人 
也很可能在不同的访谈时间里选出一致的朋友圈子名单， 

由于社会网络数据的特有厲性，尤其是在自我中心数据分析中，受访者的 

信度和效度测量与传统的其他种类数据的测量差异非常大 (Marsden， 1的 3), 

从较小且封闭的社会中抽取的自我中心样本中，知情主体常常提出许多与某一 

具体关系有关的相同的关系客体。知情人之间在选择相似关系客体上所体现 
的髙度相关性，意味着知情人的高度可信。同样地，知情人对他/地的关系客体 
特征(如年龄、性别、教胄背录、社会地位等)的播述，与关系客体对这些特征的 
自我报告二者之间的高度相关，也意味着知情人的高度有效性(这个解释假定 
所有关系客体的特征都可从其自我报告中获知，从而用于作为比较知情人自我 
报吿的亊实数据)。 





















的对偁关系数 量。 比如，关系主体报吿了 10种非定向关系中的8个，那么 J?=0. 80, 
或者80%»假如关系主体漏报了 20种定向关系中的6个，那么 J? = 0 . 70 , 
或者70%. 

要计算一个完全社会网络的应答率是比较复杂的一件事。一个完全的社 
会网络由网络中 N 个行为人配对所组成的所有双边关系所构成。对于非定向 
关系来说，1?相对就简单些，因为当测量信度较髙时，由双边关系中的一方来报 
吿便足 够了。 例如，为了测算行为人 A 和 B 之间的友谊，由任何一方知情者所 
提供的信息即可判断这种朋友关系的存在与否。也就是说，除非 A 和 B 的报告 
都缺失，否则我们就可以凭借一方的单独报告来判定友谊的存续。一般来说， 
对于一个含有 N 个行为人的非定向关系网络，当其中有 M 个行为人没有关系 
客体报吿时，某一具体关系的应答率的计算如下所示： 

1 = 100 % 当 M=0 或 M=1 
=(1 -療)X100% 当 
=0 当 M=N 










有一个点报告关系时 (M= 节点应答率和关系应答率都等于 0. 

利用一点代数推理，我们现在证明在定向网络中关系应答率总是等于节点 
应答率。假设我们有一个含 N 个节点、 M 个缺失点的定向网络，那么节点应答 


率是 (1 一 努)，而关系应答率为具体来说， 
2!X(N-2)! ) = NX(N-l) 


因此，在有5.个节点的定向网络中，当没有节点缺失时，节点应答率和关系应答 
率都是100% } 当1个节点缺失时，这两种应答率都为80%;当2个节点缺失时， 
为60沁当3个节点缺失时，为40%;当4个节点缺失时，为20%;当所有节点都 
缺失时，为0» 

在前面的论述中，我们认为，在非定向网络中，对偶关系中的某个成员所进 
行的报告可以视为是对该对偁关系的可儈测量。但学者一般都认为，这一现点 
必须谨慎采用，因为经常发生单向关系 (Stork & Richards, 1992). 例如，在一 
个交流网络中， A 报吿说与 B 进行交谈，伹 B 报吿说根本未与 A 交流。这种矛 
盾对下列做法提出了质疑，即仅从未缺席方提供的信息，来构建行为应答方与行 
为缺席方的关系。 Stork 和 Richards(1992) 建议，关系双方特征的相似性，比如他 
们的年龄、性别和教育背景等，可作为认定他们对偶关系的一〃 

另外，网络信度——由双方关系成员共同描述的所有对偶关系的 t 

-个单独的报告是在何种程度上揭示调査应答者与未应答者之间的联系。 
Ht 度高，并且关系双方具有相同的或相似的个人特征时，一方的报告可 


了一个单独I 
当网络信度 i 


>的一个很好的指标。 
关系的比例——表明 


以作为他们关系的一个可倍代表。 Kossin e ts(2003) 赞同 Stork 和 Richards 的 
方法，即当调査未应答者数量很少时，可以根据应答者的报吿来构建对偶关系 
网络。 



间的联系.在研究1985年 GSS 讨论网络时， Burt(1987) 的报告指出， GSS 自我 
中心网络研究中的数据缺失并不严重:共有1534个调査回应者，他们列举了 
4483个讨论对象，其中只有66个应答者提供的网络数据不完整，涉及195个讨 




论对象 • Burt 比较了两种讨论对象-种具有全部网络关系数据，另一种则 

只有部分网络关系数据。他发现前者关系客体的35%都与其他关系客体关系 
不紫密，这正如调査应答者所报吿的那样，而后者的这个值则升至59%。这其 
中主要的含义是，在一个自我中心关系网络中，关系客体间所缺失的关系一般 
都是弱关系。关系主体似乎更倾向于报吿那些与其他关系客体存在联系的客 
体关系，而不是那些看起来比较孤立的客体关系。这一发现也解释了与其他研 
究方法结论相反的一个现象:受过大学教育的 GSS 调査回应者，相比教育程度 
较低的回应者，往往会提供更加不全面的自我中心网络关系数据。大学毕业生 
倾向于列举那些由许多弱联系的关系客体所构成的自我中心网络，反之也将不 
会更多地报告有关客体关系的数据缺失。 

由于没有万无一失的事后补救办法来解决数据缺失问题，因此这个问題的 
解决之道只能是让更多的调査对象了解参与的重要性 (Knoke & KukUnski, 
1982*35). 为了获得较寓的参与程度，比如有些网络研究达到了 90%的应答 
率，研究人员常常要付出更多的辛苦，采取不同的说服技巧，比如个人书信、电 
话联络以及钱财激励等。数据缺失问题这一难题并非仅仅存在于使用调査方 
法进行的社会网络研究中，档案研究也容易受数据缺失的影响。一般人会想当 
然地认为，档案数据的完整性是受数据存储管理操作的影响的。然而，在某类 
数据的可得性不变的情况下，编码人员的能力与数据搜索软件的效率也间样能 
对获取信息的数量和质量产生重大 影响。 训练较差的编码员、设计糟糕的软 
件，都绝对会导致规模较大的数据缺失 4 





I 网络分析基本方法 












昧着两个行为人之间不存在直接关系。如果两点之间有一条线，那么这两点就 
是邻接的。如果某一个点是定义某条线的两点之中的一点，那么这个点就附屑 
于这条线>反之亦然。在网络关系纛表中,点的精确位置和线的长度是可以随 
意的，虽然某些版本要比另外的版本更清晰。建构一个富有洞察力的社会关系 


图，和进行一项科学活动一样，是一种艺术行为。 

假如一条线没有箭头，那么就表示这种关系是非定向性的或双向的（比如 
同事关系）。假如关系是从一个行为人指向另一行为人，那结果就是一个定 
向图表或有向图。形式上，一个有向图*点的有限集合，也是有序配对 u，W 


的集合，其中点《是线的起点，点6是线的终点。单向箭头表示一种定向关 

J 由箭尾的行为人指向箭头的行为人(例如，提供建议)。双向衡头线 

i 两个定向性联系，从每一个点到另一个点，表达的是一种互惠关系或 

S (比如，每个行为人都选择对方作为自己的“亲密朋友”)。一个替代 
模式是使用两个单向箭头*每个箭头都指向对方。一些社会关系图也通过线 
条粗细的变化，或者不同种类破折号的使用，以便更形象地表达双方关系的 


系，方向由箭 J 

条表示两个定 

相互关系（比3 


力度、密度或者频率。 


为了阑述一个社会网络结构的图表，我们利用了 Feldman-Savelsberg 等人 
(2005〉对喀麦隆妇女同乡会组织的网络研究》为了便于分析集体记忆是如 
何影响妇女们对生育的讨论， Feldman-SaveUberg 等人 (2005) 访谈了喀麦隆首 
都雅温德的6个妇女协会中的156个成员。他们的深度访谈涉及妇女社会网 


络的一些问題，比如“请根据下列标准对你和你所在协会的其他妇女的联系 
力度进行排序: （1) 知己； （2) 朗友》 (3) 认识； （4) 完全陌生'由于毎一个妇女 
仅被问及她与同一协会其他妇女的关系排序，因此对这6个协会都分别构建 


了独立的网络结构。为了简 单阐述 ，我们选取了第六协会的网络结构，它有6 


个触成员。 


图 4. 1表示第六协会成员间的社会关系图。线条的粗细表示3种层级的选 
择，没有连线表示两人之间完全陌生。在这6个成员间的23种定向关系中，只 
有15对关系中的4对是互相同意的(即两个妇女都选择了同样的层级〉 :妇女 1 





























连接 》 

弱连接:所有两点之间有连线，但不考虑其连接方向。 


&之中的几个小 
5—个连接状态 


很明显，这个6人的有向图只是个弱连接图。然而，在大网络之中 fl 
网络子集的连接强度要比整个网络图强。图表！ 

图表的极大化子图，而一个强连接图组成部分就是构成强连接图表的极大化子 

图。子图 Sally-Harrj^Tom-Betty 是一个单项连接部分，因为不同长度的 

定向性路径单方向地连接了每一对点。这个组成部分是极大化的，因为一且加 
人 Jane， 就将破坏这种单向联系》那为什么 Jane-Tom-Betty 这一更小的子 
图不属于强连接部分或单向连接部分呢？ 

在一个连接图中，如果去除一^点,将导致该图不能连接(即会创建两个或 
多个组成部分)，那这个点就是一个分界点。假如将 Harry 从图 4.2 中移除，那 
这个六点图就会分成两个小的组成部分 (Salljr-Dick 和 Tom-Bettjr-Jatte). 


同样的，如果去除一条线，会将一个图表分成两个或多个组成部分，那这条线就 
称为桥。请问这张图中包含桥么？为什么？ 

相对于存在很多维持信息和资源流的多余路径的网络，有分界点和桥 
的网络更容易受到破坏。例如，恐怖基地的秘密网络有可能因为一个关键 
人物被抓或被杀而陷入瘫痪状态 （Borgatti, 2003) Tsvetovat & Carley, 

矩阵 


网络关系的代数形式可以表达社会关系图中所有的量化信息，和直观的 
图表形式相比，代数形式能够做更多的分析。可供数学分析的社会网络数据 
的最基本形式是列表，称为社会矩阵，也称为邻接矩阵，是一个由行和列所构 
成的数值方 列阵。 例如，大写黑体的表达式 X(N, N) 表示社会矩阵X,它有 
N 个行和列,而且其 N« 个单元表示 N 个社会行为人之间的各种 关系。 行为 
人的顺序或定位可以通过矩阵的行和列来一一对应，利用下标字母 i 和只其 






，单元格可以从 0 至对偶关系水平 


【表 示反向关系，比如“不喜欢”或者 


] 乡会的矩阵图。这个矩阵是图 
: 位妇女的关系力度进行打分， 


系的评分只有 1(; 
5 。表 4. 2是图 4. 


六妇女同乡会 fi 
与其他5位妇女的关 ii 
巨阵是赋值和不对称的.行中的妇女对 
扫女是被打分的对象(行和列中的标注 
例如，妇女1对与妇女3的关系力 
1的关系的评^ 

I意义的。表 











0 0 0 0 0 


有时，网络研究人员使用非正方形矩阵表示行为人特征或者他们对某一事 
件的参与。数学符号 Z(N，M) 表示一个长方形矩阵 Z， 其中 N 是行为人的数 
量， M 是特征、亊件或地址的 数量。 例如， Freeman 和 Webst er (1994) 观察了 31 
天内43个常规沙滩客，记录了与这些人有关的353个亊件(比如野餐、游戏等)， 
他们建立了一^ 43 X 353 的矩阵，其中第 i 行第 j 列的值为1，表示第；个人参 
与了事 件）。 如果研究人员收集了不止一种关系的网络数据，那么可以分开或 
综合构建并分析多个社会矩阵。表示 i? 多元网络间具体关系的矩阵形式，只需 
要简单地多加个脚注，也就是，表示在第4种关系中第 i 行和第列的单 
元值。 



前，我们回顾几个网络数据的基本原则，它们在向度和賦值这两个维度上有所 
区别 B 向度将社会网络数据分为无向关系和有向关系两种。在无向关系数据 
中 ，一 对关系的起点和终点(例如，发送者和接受者，选择者和被选者)是没有区 
别的:如果 Dick 娶了 Jane， 那 Jane 也同样嫁给了 Dick。 其他种类的无向连接包 
括某一组织内成员关系,某一社会亊件的共同参与,以及互相交流知识等。为 
了获取无向关系资料，研究者常常只需要问一方知情者，然后利用这个应答即 
可了解这个对偶连接。相反，当对偁关系的每一方#向对方启动一种关系时， 
组合 :（1>A 绎 
A 不给 B;(3) 

£集到这样的 


有向关系发生了，结果导致4种可能的二进制组合: （1>A 给 B —些东西，比如 
信息、建议和钱等，但 B 不给 AK2)B 给 A, 但 A 不给 B;(3)A 和 B 之间互相交 
f 样的情形:关系主体的自 
我报吿认为存在某种网络关系，但这种关系与关系客体对其看法不一致。许多 
也许在理论上可以被归为无向关系的网络数据，在实际中应当视为是有向连接 
数据来 测量。 例如，为评估一项信任关系的存在，研究人员应当问关系双方是 
否信任对方。研究人员不应首先假定朋友关系是否总是互惠的，而应首先将他 
们视为是内在的有向关系： Ted 也许视 Sally 为朋友，但 Sally 可不认为 Ted 是 

她的朋友。正如第3章所讲到的，许多的认知社会结构网络关系具有固有的有 

向性，因为它们是来自于行为人对主现侑仰、态度或者关系认识知报告,而这些 
很可能是不同于关系客体的主观看法的。即使一个关系在理论上可以归为无 
向类，但研究者通常还是得选择谨慎一点的做法，.即请关系双方都提出各自的 
m#. 在随后的分析中，研究者可以利用弱标准(比如只要一方报告认同，即认 
为关系存在)，或强标准(要求双方都必须确认该关系)来整合这种不同。一且 
采用这一观点，那么在数据收集上就能使得分析者在供替代的标准假设之下验 
证他们结果的稳 健性。 

根据关系信息的可获得性，社会网络联系可以分为二进制的或賦值的量 
表。在二进制数据中，被试者只需要回应关系的存在(编码为 1) 或缺失(缠码为 
0). 在賦值数据中，他们不但要表示关系的存在与否，还要对二者交往的强度 
或频率进行排序或量化。例如，青少年会被问及在去年与伙伴发生性关系的次 
数。因此，二进制网络数据只有两个值，0或1»但賦值关系数据则展示了一个 






賦值无向关系数据需要一方来量化双方的关系。二进制有向测量只需要双方 
提及关系的存在与否。但是賦值有向数据需要最详尽的信息，即关于对偶关系 
重要性的两个 报吿。 由于自我中心网络研究和全幅网络研究在它们的研究设 
计、抽样、数据分析及其解释等方面存在极大的差异，因此下面两个小节讨论适 
用于这4类网络数据的测量。 

自我中心网络的测置在自我中心网络研究中，知情人被要求报吿与其 
有特别联系的关系客体。这种关系被明确表述在提供给被调査者的提名法则 
中。一个著名的例子就是美国综合社会调査，“讨论重要问题”的提名法，在 
第三部分有 论述。 没有独立的信息是从由1985年 GSS 被调査者所提名的任 
何关系客体那里收集的。这一小节主要集中介绍自我中心网络的密度和网络 
范围测置。 

密度是指测量自我中心网络中 N 个客体之间互相联络的程度(忽咯了关系 
主体 ego, 因为本来所有的客体都与之直接联 系）， 现假定这种关系是无向性的 
二进制(有/无)关系，那关系密度 (!》 就等于所报告的客体间对偶联系(用 L 表 
示)数除以此种关系的极大可能数： 


其中味 = 2!XCN-2)! a 例如，假设主体有 5 个关系客体，并且客体间只报吿 
了順，由于心^『 獻 y 二 普 10 ,， 
么这个社会网络的关系密度就是 D = ^ = 或 20 %. 

如果一个自我中心网络的联系是根据有向二进制来测量的，那么密度计算 





公式就为: 










间没有任何联系 ,1 表示所有的客体间都存在直接互相 联系。 这种限制的存在 
是因为二进制网络密度的分子不可能大于分母。对于无向和有向二进制数据 
二者来说，双方实际关系的数量必然要小于或等于所有可能的对偶关系的最大 


数(当 L 仅表示关系的存在数量时，当 JL 不仅考虑关系的存在，还考虑 
关系的方向时， L<2XC^〉， 然而，对賦值的自我中心网络数据来说，密度能够 
超过 1. 00,因为对关系特征的賦值也许远远大于二制数据的最大关系值1, 

网络范围在广义上被定义为一个行为人的网络与其他不闻柠为人的联系 
的程度。在实践中，研究者利用多种经验标准来测量网络范围，例如网络规模、 


密度和多样性 (Campbell, Marsden &- Hurlbert, 1986). 而且，自我中心网络 
多样性测量的是一个个体网络中客体社会特征异质的輕度。依据客体特征的 


测量水平，自我中心网络密度可以通过连续变量的标准差来进行测量，或者通 


过分类变量(包括离散的或有序的)的定性变化指数来测量。 

当一个客体特征按照连续变量来测量时，标准差反映的就是一个自我中心 
网络内特征的差异性 9 一般来说,对含有 JV 个客体的第 i 个主体，其中第 j 个客 
体的特征是一个连续变量，那么标准差就是： 



所有主体标准差的平均值可以测量一个自我中心网络_本中特征的多样性。 
Marsd en (1987) 发现，1985年 GSS 调査所得客体教育年限的平均标准差只有 


1. 37年，这意味着在美国人的核心讨论圈中讨论对象都倾向于拥有相似的教育 
水平。 


当客体特征是按照分类变量来测量时，那 IQV 就是用来测量自我中心网络 


的多 样性。 通常,对含有 iV 个客体的第£个主体而言，其中所有客体都被分成 


K 类离散的或有序的类别，那 IQV 等于 




其中辦是第）类中客体的比例。 IQV 的标准值介于0, 00 W 1.00 之间，其中 
0.00 表示所有的 N 种情形都包含在一个类别之中，而 1. 00表示所有的客体都 
均匀分布在 K 个类别内。例如，假如某主体提名了 4个男性和1个女性作为关 
成 IQV 就是 = 0. 64；当某人提名3个 
浓 N 那得到的性别构成 IQV 就是 0. 96。因此，后一自我中心网 
络展现了更大的性别多样性。所有关系主体的 IQV 均值构成了一个样本定性 
多样性的分类变童指数。利用这一方法， Marsd en (1987) 报告说美国人自我中 
心网络的性别 IQV 是 0. 68,而种族 IQV 只有 0. 05。很明 i， 美国人的核心讨 


潘体 ，那性别构成 IQ， 
5性和2个女性时，那农 


全幅网 络测霣 在自我中心网络研究中，一个中心个体通过列举与他/她 
有特定关系的客体来构建其 网络。 除非从一个高密度社区抽样——其中关系 
主体和客体之间都联系紧密 (White & Watkins, 2000) ，否则某一个主体的关系 
客体极少与另一主体的关系客体有关系。因此，之前部分中讨论的密度测量是 
建立在互无联系的知情人所提出的关系客体的特征基础之上的。相反，在全輻 
网络研究中，研究人员设定一个网络边界，只关注在此范围内的行为人之间的 
联系 • 例如， Kra C khardt(1987) 的研究关注某一组织内21位高级技术经理人。 
每一位都被要求确认是否从其他20位经理人那里获得过建议。利用全幅网络 
设计获得的数据，只由所选出的这些行为人的联结构成 4 通常，选定范围之外 
的行为人的联结是不会考虑的。因此，把任何一种自我中心网络密度测量法应 
用到全幅网络中只得到单个的值。 N 个行为人的随机抽样，产生 N 个自我中心 
网络密度值，因为每一个行为人的自我中心网络都不同于其他行为人。相反， 
全幅网络有一个群体的单个密度值，不论总体 JV 是多少。尽管在分析层次上有 
这种差异，伹对于自我中心网络和全幅网络而言，这4种密度测量的计算公式都 
是相同的。 

除密度之外，可广泛适用于全櫥网络的其他关系测量方法还包括节点度、 
行程、轨迹、路径、回路、组成部分、测地距、直径、分界点、桥、树、同构子图等等》 
本书无法做到对所有这些方法进行详尽阐述，相关资料可见 Wasserman 和 

















络平均节点度数为 | = 1. 4。一些学者认为，一般意义上节点出度表示扩展程 
度，而节点入度代表接纳程度或者受欢迎程度 （Wasserman & Faust, 1994: 
126). 根据这种有趣的观点, A 是一个开朗型的行为人一会选择他人作为朋 
友，但是他是一个在网络中最不受欢迎的人。相反， E 是最受欢迎的，但相对来 
说他是个内向型的人。 



对于计算賦值图的节点度数，通过网络文献回顾可以得到些许启示。其中 
4简化的解决办法，就是将赋值图中所有的非零值替换为1，然后采用二进制 
图的处理办法 * 但是，这一方法忽略了賦值图中有关联结力度的丰窗信息。在 
此，我们推荐一个概括的办法，用于计算賦值的无向图的节点度数。这一方法 
将一个行为人所有线条的賦值加起来。然后，该賦值的无向图的平均节点度数 
就是所有賦值节点度数的总和除以行为人的总数。图 4. 5中 A、B、C、D、E 的 
节点度数分别为5、13、7、5、1厶因此该图的平均节点度数是 


5 + 13 + 7 + 5 + 12 , 


会产生较高的节点度数:行为人线条值低，但数量多》行为人线; 


S 反的情形之下， 
5条数量少，但赋 


值髙。例如，有一朋友关系网络，其中的线条賦值表示朋友关系节点的 力度。 













接向 B 发送信息，或者通过 E 、 D 、 （:向 B 间接地发送信息。但是通过中介传送 
信息容易延误或者歪曲，因此正如 AB 间的测地距所分析的那样， A 最有可能直 
接与 B 交流，相反， B 既不能直接也不能间接地向 A 发送 信息。 实际上， A 只 
能充当一个信息发送者，而不能作为一个信息接收者,因为没有人与 A 交流， 
这个例子生动地描述了信息的流动并非是互惠的。 


当考虑每一条路径的赋值时，计算赋值有向图的测地距会面 临一些 困难。 
我们可以将賦值图简化成二进制图，然后运用二进制图处理程序，但因此也浪 
费了这些賦值所提供的丰富信息。 Yang 和 Knol £ e (2001) 提出了一个解决之道， 











Yang 和 Kn O k e (2001> 的方法可以运用于賦值有向图中两点间的测地距的 
计算，不过关系的方向必须被考虑其中。图 4. 6连接 A 到 B 的两条路径是 AB 
和 AEDCB, 其中 AB 平均路径值是2, AEDCB 的平均路径值是 0. 25。选择最 
大的路径值，那 AB 间的测地距就是2。然而，连接 BA 间的测地距是无法确定 
的，因为 B 无法通过任何路径到达八。 

节点度和测地距是社会网络分析的重要测量 方法。 节点度比较容易计算， 
并且常能为实际运用提供大量侑息》节点度一般表示一个行为人参与网络行 
为的程度。例如，朋友关系网络中的节点度低，表示该行为人朋友较少.对全 
幅网络而言，平均节点度表示行为的综合 水平， 例如，一个社区住户间串门的 
平均节点度较低，意味着邻居间活动少。节点度也是节点度中心度测量的一个 
基础,这个在下文中将要讨论到。两节点间的测地距是节点之间关系亲密度非 
常重要的标准。由于每对行为人间都有几条路径相连，因此测地距就是每两节 
点间的最短路径，也是基于距离的综合法的基础，例如多维标度和多层聚类分 
析，这些在本节的后面将会进 行讨^ 

中心度和声望 

图论在社会网络分析中的一个主要作用是，在个人分析层次和耨体分析层 
次上,找出其中重要的或突出的行为人，中心度和声望的概念及测置通过综合 
所有点之间的结构关系，试图将图论关于全幅网络中行为人知名度的理念进行 
量化。对知名度的分析，将考量社会计量学上的选择与被选择，有时也包括间 
接关系的结构。个人行为人的知名度反映了他/她在其他行为人当中较为明显 
的可 见性。 群体层次上的中心度和声望指数，评估所有行为人的知名度在一个 
网络中的分歡程度或不平衡程度。在本部分中，我们讨论两个有关知名度测置 
标准的大致分类:(1>中心度，无论是作为关系的发起者还是接受者，当一个行 














0>(凡)=气^ [4.2] 


这个标准化行为人程度中心度测量，使用行为人 i 的程度中心度值除以与其他 
发一 1个行为人最大可能连接数,得到与行为人 i 有直接联系的网络成员的 
比例 • 


这个比例从 0. 0到 L 0, 0. 0表示与任何行为人都没有联系(例如一个孤 
点)， 1. _示与每一个人都有直接联系。标准化的行为人程度中心度测量行为 
人在诸多关系中的参与程度„得到高分的行为人是网络中最显眼的参与者。 

E 中心度值越接近 1. 00,那么行为人在关系网络中的参与度 
[看重行为的纯粹数量而不是无向关系的具体来想和目标 
?易#中心度这一概念运用于倍息网络的获取、控制和居间 


人在捃多天糸甲的翏与 荏皮 。 1 

尤其是，标准化程度中心度值越; 
越高》假如研究者更看重行为& 
的话，那么他们很容易蒋中心度 
行为的分析 (Knoke & Burt, 19； 


述统计学的离差测量，例如标准差，表示围绕中心趋势值变化或扩散的量。 
F r eeman(1979> 提出了组程度中心度的通用测量方法： 



[4.3] 


其中， Ca (N* ) 表示网络中所观察到的行为人程度中心度的最大值，而 C A (Ni) 
是器一 1个其他行为人的程度中心度。因此，分子是行为人最大中心度与其他 
所有人的屮心度之差的 总和。 分母是这些差值之和的最大理论可能值。 

按照 Freeman 的通用测量方法, Wasserman 和 Faust<1994,180) 在他们的 
组程度中心度指妓中提出了有关分母的处理方法： 





之和，分母测量差值的最大可能总和。这个值可能发生在星形图中，其中一个 
节点与其他所有节点相连，但其他所有节点都只与第一个节点相连 • 因此第一 



点的程度中心度为1时，表示最大的不均勻 分布。 分子等于分母，组程度中心度 
指数为 1. 0。因此，组程度中心度越接近 1. 0,社会网络中节点的程度中心度就 
越不均匀或越呈等级分 化状。 


亲密中心度行为人亲密中心度是用于反映在一个社会网络中某一节点 
与其他节点之间的接近程度 (Sabidussi，1966) • 亲密和距离指一个行为人能多 
快与他人联系上，例如通过直接交流或者极少的中间环节。行为人的亲密中心 
度是它与其他点之间测地距的函数(如前所述，测地距是连接两节点间的最短 
路径长度)。行为人亲密中心度指数为行为人 i 与 — 1个其他行为人之间测地 
距总和的 倒数： 




他行为人有相对较长的距离值。 

当某一行为人与所有其他人关系亲密时，即在网络中与每个人都有直接联 
系时， a = i/(g-D, 该值随网络规模大小发生变化。 

为了控制网络规棋便于不同网络间行为人的比较， Bea U ch a mp(1965) 建议， 
通过乘以 ( g - D 来标准化行为人亲密中心度指数： 

Cc(Ni) = (.g- lXCfcCN；)) [4.6] 

为了比较和对比亲密中心度与标准化亲密中心度指数，我们参考两个例 
子 * 图 4. 7展示了一个3节点网络结构图，其中节点 A 宜接与节点 B 相连，测 
地距为1;间接与节点 C 连接，测地距为2。因此，图4: 7 中节点 A 的亲密中心 
度是 1/0 + 2) = 1/3. 


图 4. 8展示了一个4节点网络结构图，其中所有点之间都有直接连接，行 
为人 A 与 B、C、D 都有直接联系，测地矩均为1。因此，行为人 A 的亲密中心 
度值为 1/(1 + 1 +1> = 1/3。虽然图 4.8 中的行为人 A 与其他关系人的直接联 
系要比图 4.7 中的行为人 A 更多，但二者的亲密度值是一样的，因为第二个网 
络更大。为便于比较，标准化亲密中心度将网络规模考虑其中，对这两种情形 
进行了区分 • 图4, 7的行为人 A 的标准化亲密中心度值为 （3 — 1X1 / 3 ) = 
0 . 67 ，而图4 8的行为人 A 的标准化值更高一点，等于 （4 一 1) (1/3) = 1. 0。行 
为人的亲密中心度值越高，那么它与其他行为人的关系越紧密，从某种意义上 


来说，就是该行为人可以通过较短的测地距通达其他所有的节点 4 



i， 组亲密中心度也是一种离差测量，表示在一个网络 
L 具体来讲，组亲密性中心度澜量一个给定网络内行 















当所有的测地线都经由某一主要节点时，组间中心度为 1. 相反，如果在 

一网络中每一个节点都有相同的中间性中心度，那么分子为0,组层次中心度也 
为 0. 0,因此，中间性中心度越接近 1. 0,网络内中间性中心度越是不均衡分布， 
寅望许多情况下，社会网络数据收集包括指导如何在调査中确定网络关 
系的发起人或发送人和终结者或接收者。在这样的有向图中，仅仅参与或融人 



我们将声望定义 为一个 网络中的一个社会行为人接收他人所发出的关系 
或被他人视为关系客体的程度。这种发 送者一 接收者或源头一目标的区别，极 
大地强调了对资癉控制上的不平等，以及伴随这种不平等而来的权威和服从 
(Knoke &■ Burt, 1983,199). 

根据这个定义，声望可以简单地通过计算某一个行为人接收其他行为人某 
种特定关系的有向连接数量来测量。例如， Laumarm 和 K n0 ke(1987,163) 询问 
美国能源和健康政策领域的知情人士，请他们确认“对制定国家能源/健康政策 
具有特别的影响力和重要性”的机构 名单。 每一个提名都得到平等对待，没有 
将其来源进行区别对待，这样所获提名便反映了一个行为人在系统内的受欢迎 
程度。 Wassemian 和 Faust(1994:202) 指出，行为人程度声望可以根据有向图 
的节点人度来 计算： 

Pd (. Ni ) = 2^0' [4.11] 


因为这一测量加总由《•个节点所组成的非对称社会矩阵中的第£列的值， 















2« I 


有的行为客体直接连接，因此可以作为毎对并不直接相连的客体间的中介点。 

Marsden(2002410) 宜称，在自我中心网络中，节点 i 的中间性中心度的测 
量不同于全幅网络 • 一方面，在自我中心网络中，节点 f 的中间性中心度会偏 
小9自我中心中间性测量不包括主体节点 i 的中间位置，这中间位置是任何一 




节点 i 的2个客体 (A 和 D> ，虽然 M 本身并不是节点£自我中心网络的一部分。 
节点 f 的4个关系客体构成6对关系 (AB、AC、AD、BC、BD、CD), 其中每 一 
对都有一条独特的测地距路径。由于只有 BC 是直接相连的，而其余每对关系 
的测地距路径都包含主体点“因此 i 的中间性中心度在自我中心网络中是5/6。 
然而节点 M 的出现，使得节点 f 的自我中心网络中间性中心度和全幅网络中间 
性中心度之间产生了差别。一方面，节点 i 自我中心网络中间性测量偏小，这是 
由于忽略了节点 i 在两条测地距(对点 MB 和 MC) 中的媒介位置。另一方面， 
由于忽略了 AD 间的测地距通过点 M 的情形(这与通过节点 i 的 AD 间测地距 
形成了竞争)，节点 i 的自我中心网络中间性值又会偏大。 










全幅网络的行为人中间性中心度的可靠 替代。 Ma rs den(2002) 认为，自我中心 
网络和全幅网络中间性结果的差异也许是由于两种网络数据收集的不同造成 
的，而这是一个值得进一步系统性研究的重要课题 • 


小团体 

内聚力与一个社会群体或封闭社会关系圈中的亲密程度的概念密切相关 6 
内聚型亚群体由通过多种直接互惠的选择关系相连的行为人构成。他们之间 
能够共享信息，团结互助，一致行动。所有的亚群体成员间有多种直接联系，很 
少或几乎不包含外来者，倾向于构成一个在思想、认同和行为方面具有同质性 
的 群体。 内聚型亚群体的例子包括异教组织、恐怖活动小组、犯罪帮派、军事行 



念来分析研究群体结构，可以帮助研究人员更好地理解内聚力是如何通过提供 
建议和利益支持来帮助群体成员的 (Dunbar Spoor, 1995>,更好地理解对小 
团体的广泛信赖是如何限制网络联系的范围的 (Blau，Ruan&- Ardelt, 1991)。 


社会学的概念，诸如组、群、圈子、帮派、派系、小团体等并没有严格的区别， 
可以互换 (Borgatti，Everett Shirey, 1990)。在对社会网络研究中大•关于 
亚群体的文献进行总结后， Wasse_ 和 Fa US t(1994:251) 分析出了关于内聚 
型亚群体的四个普遍 特征: 连接的相互性、亚群体成员间的可联络性、成员间联 
系的频率，以及与圈内成员间相对于与非圈内成员间联系的相对频率。这些特 
征是定义小团体和网络亚群体相关测量的基础。 

小团体一个小团体是含有3个或多个节点的最大完全子图，其中所有的 
节点都互相直接连接，网络中的其他点都没有与小团体中的每一个成员有直接 









联系。因此，在一个小团体中，每对节点间的测地距都是1.0。也就是说，每两 
个节点间都由一条直接路径相连。图 4. 10描述了一个含有6个节点的二进制 


无向性网络中的小团体。两个小团体 ABE 和 
虽然 F 与 A 和 C 都有连接，但这3个点并没有 


BCDE, 每一个都符合必要条件。 
构成一个小团体，因为 A 和 C 没 


有直接联系《 4个其他的小群体 (EBC，EBD, BCD, BDE) 也不是小团体，因为 
另外还有其他的点与这些小组别的所有三个点直接连接。例如, EBC 并不是一 
个小团体，因为点 D 与 E、B、C 直接相连。只有 BCDE 这个最大的完全子图符 





















被另外的结构等价的种植者替代，从而保持原来的网络不发生变化。为了从其 
他网络参与者那里获取适宜的反馈，社会网络中的完全可替代性常常导致激烈 
的竞争，众所周知的例子躭是小学生为了获得老师的特别青睐而互相竞争„利 
用结构等价方法的网络研究学者往往对理解竞争关系有兴趣，而不是对群体内 
聚力有兴趣 (Burt, 1992〉》 

与小团体的定义类似，结构等价的定义也是非常严格的。在有向二进制图 
中，如果两个行为人在与他人发送和接收关系时具有完全相同的连接模式，那 
么他们在那种具体关系上就是完全结构等价的。更详细地讲，对于网络中所有 


i 括节点 i 和）>，如果节点 i 发送一个连接给I当且仅当节点 j 
i 给如果节点 i 从 A 接收一个连接，当且仅当节点 j 也从灸接 
么节点 i 和 j 就是结构等价的 （Wasserman & Faust, 1994 s 






连接，严格来讲，只有当賦值图的两个节点在与其他节点的每一个连接中都具 


有完全同样的值，这两个节点才是价的。 

对于实证网络分析的实际运用来说，完全结构等价性的上述定义通常太过 
严格。真实网络数据中极少有数据能够满足这样苛刻的标准。然而，当一些节 
点与其他节点的关系模式高度相似，尽管不是完全相同，但我们也可以认为这 
些节点是大致结构等价的I。为了获得这种近似性，研究人员利用关系相似性的测 
量，而不采用严格的、非 ib 卩彼的完全结构等价的标准要求，两个节点各自与其 
倾有节点的连接越相似，那这两个节点就越接近躺紙 

基于网络关系相似性的两节点间的结构等价，只要求他们与其他节点或有 
或无的关系模型高度相似即可。假定存在一个二进制有向图，两个结构等价的 
行为人，在其社会矩阵对应的行和列中的条目非常笛同。根据这一原則， Burt 
(1978) 提出将欧氏距离作为澜量行为人；和 j 结构等价的一种方法： 


da 一邱） 2 + (x« [4.13] 

其中办是行为人 f 和 j 之间的欧氏距离，•是社会矩阵(第一个下标表示行， 
第二个下标表示列〉的值(对于二进制关系来说就是1或0) # 由于是两个差 
值的平方和的正平方根，因此每个办 >0. 假如行为人 i 和 i 与其他行为人之 


间拥有非常一致的连接，那么所有的差值 Uii —印）和 -XH ) 都是因此 
这两个完全结构等价行为人的欧氏距离4：/ = 0。但是在绝大多数实际例子中， 
观察到的办值要大于0;因此，行为人 i 和> 在某种变动的程度上关系类似，欧 
氏距离与行为人的相似性相反，因此也与结构等价相反吨值越大，行为人 *• 和 




人 C, 但是行为人 D 接收了行为人 A 和 B 的连接，而行为人 E 却没有得到任何 
连接。利用表 4. 3的二进制值，可以计算行为人 A 和 B 的欧氏 距离： 


— XEC ) Z + ixCA — XCB ) 2 ] + L^AD — ) Z + 

^ y — xre) 2 ] + [(a ： >4E—XBE) 2 + <J ： E4—arra) 2 ] 

/ [d—l) 2 +(o—o) 2 3+[d — i) z +(o—o) z ] + 
diz = / [ 4 . 14 ] 

V [(0-0) 2 + (0-0) 2 ] 

其中出 2 = 0,表明行为人 A 和 B 是完全结构等价。你能否算出点 D 和 E 之间 
的欧氏距离是 7^ = 1. 41? 

由于无向二进制图不区分关系的发送者和接收者，因此它的欧氏距离计算 
就简单得多： 


da =^1 ^ (x* [415] 

当网络呈现多重关系时，欧氏距离就得计算所有 i? 种关系的对点差值的平 
方和， 


dii =^§15 - XjkrV - + (.xur ) 2 ](* [4.16] 

与通过欧氏距离来计算异质性不同的是，皮尔逊相关系数〜直接测量关系 
的相似性，其中对点关联值越高，表明结构等价度越大。我们将在本节块模型 
部分讨论相关性问题。 





»4.12 f 节点网络的结构等价有向 a 





网络图像在社会网络研究中普遍用于展现和传递网络结构的亮点。社会 


网络分析 在视觉 演示的发展过程中经历了三个明显的阶段 （Freeman, 2000, 


2005)。起始阶段大概在20世纪30年代，当时 Jacob Moreno 发明了一种手绘 


的即兴社会网络图，用来描绘诸如学生等行为人之间的关系 (Moreno, 1934). 
这种自由式的方法很快就让位于通过标准计算程式来标示点和线的图。可视 
化初始阶段 的一个 基本原则就是所示空间应该代表行为连接的模式，即在数据 
矩阵中社会关系最近的对点，在可视图像中也能看得出来是距离最近的 


之间关系的 


2005). 然而，在二维或三维的视觉展示图中，精确标注多位行为人 
亲近度和距寓，通常*不可能完成的任务。因此，研究者最 绛采用 


系统简化、维度减少但依然能够反映原始数据模型的办法。可视化第二阶段始 


于大约20世纪60年代，用大型电脑主机和软件自动生成图表，尤其需要指出 

，网络分析不断利用这部分将要讲到的分层聚类法和多维标度法。最近的 

^始于20世纪90代中期，随着因特网、高速计算机网络和浏览器，以及个人 
电脑普及化时代的到来，关系数据库的大型可视化展示，包括纵向网络变化的 
动画展示，就有了新的机会(例如 Brandes，Kenis, Raab, Schneider & Wagner, 




揭示它们内部的关联性是非常有用 的 9 在此过程中，可通过将众多行为人概括 
为数量较少的共同占据位置，对复杂的网络结构进行简化。结构等价方法计算 
和分析对点异质性(欧氏距离〉或相似性(关联指数)的矩阵模型，来确认由行为 
人与其他人相同或相近关系棋型所构建的亚群体所占据的网络位置。聚类和 
多维度标示法运用于结构等价矩阵，来确认共同占据位置，以二维或三维图的 
形式来展示 结果。 


聚类分层聚类分析，或者简称为聚类分析,将行为人分成亚群体(共同占 
据位置)。这些亚群体成员是标准的或近似的结构等价。每一个行为人开始都 
被当成一个单独的聚类，然后这些单独的聚类依次联合起来，直到合并成为一 



在计算对点的欧氏距离矩阵之后，聚类分析开始根据一个阈值《对行为人 
进行 合并。 这个阈值作为分析者的一个上限>让他们决定在一个结构等价的特 
定水平上，哪一个行为人厲于同一个关联性占据位置(聚类)。仅当办时， 
行为人 i 和） 共同占据一个位置 # 在一个聚类中的行为人互相之间的社会距离 
要小于他们与其他聚类中行为人的距离，即聚类内的行为人更具有结构等价 
性。通过聚类演绎法，不断将 a 的值放宽(即 a 值变大），并运用于整合行为人的 
过程，直到整个网络合并成一个 单一的 全涵兼聚类。尽管分层聚类法获得一些 
非交叉聚类，但聚类还是嵌套的;也就是说，较小的聚类依次包含在 a 值高的较 
大聚类中(即，结构等价度越低，相似性越小，那么聚类内距离就越大)。最终， 










研究人员必须决定哪一个层面的块(即哪一个 值)能够为网络中结构等价位置 
数量提供最好的替代。 

研究者可从形成聚类的三个基本标准中进行选择:单个联结，平均联结， 
或完全联结。给定《值的水平，当两个关系最为亲近的行为人距离小于 a 时， 
单个联结标准将两个聚类合并成一个聚类 4 在完全联结标准下，当每一对行 
为人的距离小于《时，两个聚类进行合并 s 平均联结标准是一个折中的选择， 
要求两个合并的聚类中两类行为人的平均荦离小于 a 。 实证研究发现，每一 
种选择都存在有利和不利的一面，研究者应当根据具体的情况来调整所选的聚 
类分析方法 (Aldenderfer Blashfield, 1984,53-62). 完全联结聚类倾向于 
得到数量众多的同质型和紧凑型的聚类，而产生“链”的可能性 较低* “链”在这 
里指依次增加一个行为人即可形成一个单一的较大的聚类 （Burgim 1995, 



前面的内容主要讨论了小团体、聚类和结构等价等有关的概念和方法。这 
些网络分析方法普逋用于揭示社会结构的基本要素，诸如社会内聚力(小团体 
和聚类)或结构性竞争的程度(结构等价性)。因为这些方法探査社会结构的中 
间层次，因此他们承上启下，将社会网络的微观模式与社会结构的全最网络连 
接起来。下面我们讨论多维标度，这是揭示网络行为人结构的另一个非常重要 
的 方法。 

多维标度多维标度 (MDS) 是将数据结构进行可视化处理的第二个基 

本方法。 MDS 的主要目的是，发现那些能够反映网络行为人之间相似性和差 

异性(距离)的有意义的维度《如同聚类分析所述， MDS 的典型要素是一个欧 
氏距离为(办）或关联指数为(巧）的容阶矩阵，其中容是具体关系中行为 
人的数董。 MDS 的可展现结果是一张图，或称为社会关系图，其中较短距离 
(较大相似性)的关系行为人比较远距离(较大差异性)的关系行为人在空间 
上要离樽近一点 • 虽然 MDS 图能够展示多个维度，但大多数分析一般都只是 
表达二至三个维度 * 

在 MDS 图中所表示的行为人之间的距离与输人矩阵图中的相似性或差异 
性值相关但不完全相同。这个距离反映的是通过 MDS 程序所估算到的这些数 







据中对点间的距离。应力这一概念测量所观测到的矩阵和所计算到的矩阵二 
者之间所有点的差异性 (Kruskal & Wish, 1978： 23-30), 


— ST ㈣ ^ 

其中，/(邳>是输人值的一个非计量性的、单一的函数 (Kruskal & Wish, 1978, 
29>，办是呈现在图中行为人 i 和 j 之间的欧氏距离。 Scale 是一个应力值在 0.0 
至 1. 0之间的测量指示因子。如果一个 MDS 图将一组输人数据转化成标准的 
图值，那么对于所有的 i 和 j 来说 /( 吻 =咖），应力将等于0,所以，应力值越 
低， MDS 图的空间就越能够代表所观测到的网络行为人的社会 距离。 基于这个 
原因，应力概念也被称为 MDS 拟合度的测量法，其中应力值低于 0. 1被认为是 
拟合得非常好，应力值在 0. 1至 0. 2之间被认为是拟合度适中，应力值大于 0. 2 
就拟合较差 （Kruskai & Wish, 1978：52, Slez &- Martin, 2007). 

MDS 曾经被运用于各种研究。例如，和 JVfarti n (2007) 利用 MDS 对各 
州一段时期内随时间变化投票的相似性进行绘图比较. Whit, Kim 和 Glick 
(2005) 对多伦多地区的50个种族群体绘制了社会空间位置图。 MDS 的最大优 
势，是允许他们同时分析所有的种族群体，而传统的分隔研究方法则将每一个 
群体与所有其他群体进行分离对比， 

为了描述聚类和 MDS 这两种方法是如何能够一起联手掲示结构等价网络 
位置，我们可以看图 4. 13和图 4. 14•图 4. 13分层聚类树图和图4 14 MDS 图 
都是基于欧氏钜离,而该欧氏距离是从图 4. 12的二进制网络数据计算出来的。 
聚类分析使用完全联结选择:当所有行为人之间的距离小于《值时(这些值显示 
在图 4. 13图的水平轴上），聚类合并在一起。例如,行为人 B 和 E 间的欧氏距 
离 (《) 是 0.00( 标准的结构等价)，因此树图首先在欧氏距离等于 0. 00这一阶段 
将 B 和 E 合并。有两个聚类出现在欧氏距离等于 1. 00这一■阶段:一个聚类合 
并了行为人 A 和 C， 另一个聚类将 D 与 B-E 这一现存的聚类合在一起 4 在欧 
氏距离 a = l . 73 时，这两个聚类合并了，表明所有对点的欧氏距离都小于 1. 73, 
最后，在欧氏距离200时，行为人 F 与 A—B-C—D-E 聚类合并，表明 F 





行为人 B 和 E 在图中正好占据着同样的点，因为他们是完全结构等价。虽 
然对于确认聚类来说，《值的选择在一定意义上是随意的，但我们仍然建议选择 



—个值，它能够平衡网络行为人之间的内聚力和分裂性。例如，如果我们已经 
知道欧氏距离为 0. 00,那么我们将有5个聚类山和 E 构成一个聚类，另外4个 
行为人占据单件聚类的 位置。 为方便比较，现假设我们选择 a = 2. 00,那么结 
果只有2个聚类: (A-B^C-D-E) 和 (F) „第一个选择标准，由于其亲密关系 
设置上的高门槛，产生了大童的分裂 性雨第 二个值，则使得门槛降低，得到了 
较大的内聚力，然而，没有一个方法能够傈中间值《 = 100时提供的信息，即揭 
示联合占据位置之间的结构关系，为这个网络的分离性与内聚力提供一个更平 


MDS 的一个延伸运用是加权多维标度 (WMDS). 它在传统的 MDS 方法 
»增加了加权因素，用于代表矩阵间变化的倌息，因此, WMDS 允许多重矩阵 
被进行系统性地区分，从而对距离模型进行概括。例如，假如每一个矩阵都对 
应一个不同的个人，那么 WMDS 利用权重就可以对这些个人思考和想象他们 
的关系进行不同的刻画。基于这个原因， WMDS 也被称为个体差异标度 ONI> 
SCAL). 虽然我们不能在这里更详尽地讲述 WMDS， 但我们鼓励有兴趣的读者 
向 Schiffman, Reynolds 和 Young(1981:55—85) 咨询，还有 Han(2003> ，他对此 


方法有最新的运用。 


块模型 


块楔型是一个矩阵代数方法，将网络行为人分类成联合占据的、结构等价 
性的位置。块棋型方法开始由 Hwrision White 和他的助手研发 (Boorroan 
White, 1976； Schwartz, 1977, White et al, 1976). 自此开创性工作之后，研 
究者巳经将块模型方法成功地运用到各种问题研究中，从跨组织网络 (Knoke & 
Rogers, 1979) 到新技术的扩散 (Anderson &Jay， 1985)，再到世界体系中的城市角 
色 (Alderson & Beckfidd, 2004)。方法研究者也加深了块模型搜索和划分法则的 
研究 (Nbwichi & Smjders, 2001 j WinsWp & Mandel, 1983» Wu, 1983)。 因为篇幅 
有限，我们在这里不继续讨论这个大的话題,在本节集中讲述块模型的基本问题 
及其应用和结果的 阐释- 



，体或位置。块这一术语指结构等价行 
为人的一 f 亚方阵，其中的行为人与其他块中的行为人具有相似的(如果并非 
完全相同的话)关系。建立块模型是一个数据简化技术，通过重新对行为人进 
行分组，提出浓缩的综合信息，它将对网络数据进行系统性搜索，从中找出 
关系模型。结果就是重新排列置换过的密度和图像矩阵，表示每一种类关 


有向或无向的联结，二进制或賦值 的图。 我们的块模型例子是基于 UCI- 

NET 的 CONCOR 运算法则，它能够同时处理二进制数据和赋值图。我们 

这里只讲述二进制数据矩阵，并推荐读者阅读 Dorian, Batagdj 和 Ferligoj 


(2005:347 — 360) 的相关文献，以进一步了解二进制数据和賦值图的块模 
型分析， 

可以利用理论原则事先构建一个块模型，例如将不同管理部门的雇员分 
类成不同的块。然而，该方法的最普遍运用是对关系数据的经验模式进行调 


査搜寻。建立块模型常常使用 CONDC«(Convergence of iterated Correla¬ 
tions) ，这一方法在多个社会网络分析程序中都可以找到 (Schwartz, 1977). 


C0NDCK 可以通过关联对行、对列，或者同时通过关联矩阵的两个向量进行 
运算 • 为教学之便利，我们这里仅关联列项。首先, CONDOR 计算二进制客X 
g 阶社会网络矩阵图中每一对列项的皮尔逊相关系数(对于块模型1?多重关 
系来说，独立的 gXg 矩阵是堆积起来的，即安排成为一个单独的二维数据阵 


列，其目的是输人给 CONDOR). 这些计算不包括每对点间的直接联结，因为 
它们的结构等价性仅仅依赖于对点与其他容一2个网络行为人的联结关系。 
假如行为人 i 和> 与其他行为人有着几乎完全相同的联系，那么他们的相关 












断问题,因此一个选定的特定值容易受到独断性方面的批评。为了回应此类批 
评，研究人员应当尽量在理论和实践上提出合理理由，而不能仅仅诉诸利用之 
方便 (Scott, 1991,136). 

作为块模型运用的实际范例，我们分析了美国1988年里根政府执掌行政权 
力时期国家劳工政策领域中的政策交流网络 (Knoke et al, , 1996). 这个政策 
领域的核心由24家最有声望和影响力的政治组织组成，由知情人士从117个该 
领域的组织中选出(参见表 4. 4,组织名称首宇母缩写）。图 4. 15是得到确认的 

















5 USW 100100010000.0 00000001 100 

6 ABC 000000111010000101011110 

7 AGC Q0100101101 0. 000101011111 

8 BRT 000000101110001111010010 

9 CHAM 001001110110110101111110 

10 GM 000000011010000000001110 

11 NAM 000011011100000100011010 


00000000000010000000000 

01000001000000000000Z11 

00000001001100000000001 


100000000100000000 


0010000010000000 


0 0 0 1 0 1 0 


20 WHO 101001111100000001000110 

21 HR 001000011110000100100010 

22 HD 00000000000000000000.0 000 
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I 网络分析高级方法 


在这一聿中，我们将讨论有关网络分析的高级方法。我们尤其要评论网络 
位置测量、 logit 模型 P* 、隶属网络和点阵分析。 

网络位置测量 

在社会网络分析中，角色和位置是核心概念，利用代数和矩阵方法对互锁 
角色的分析，始于& F. NadeKl957) 关于社会结构的理论。在其理论中，他将社 
会结构视为位置，而该位置拥有与其他位置相关的独特的权利和责任，在第4 
聿讨论过的结构等价，为确认社会网络角色和位置提供了一个基本的方法。然 
而，它要求结构等价的行为人与同样的其他行为人具有相同的连接棋式，这一 
要求对于该方法的实际运用来说，太过苛刻。虽然放松关系相似性这一要求可 
以扩展该方法的运用，但是在行为人基于自身的关系模式联合占据位置方面， 
结构等价依然有着非常严格的定义 * 作为一个眷代性选择，网络研究者创造出 
多个适用条件没有如此严格的方法来确认网络角色和位置 (Borgatti Ever¬ 
ett, 1992» Everett， 1985 > Everett, Boyd & Borgatti, 1990； Faust, 1988； 
Pattison, 1988)。 在适用条件严格的降序排列中，结构等价是最严格的,其次是 
自形和同构等价，再次是正规等价。本部分对后两种方法进行非技术性的一般 
回顾。虽然自形和同构等价经过一些调整能够被用于有向和赋值图 （Wasser- 
man & Faust, 1994:461—502)，伹为阐述的便利,我们还是在举例中利用了一 
个单个关系的无向二进 制图。 

同构和自形等价是两个关联性很强的概念，以至于一些研究者认为它们是 





可以互相養代的 (Borgatti & Everett ，1992). 但是，同构等价运用于两个图，而 
自形等价只能描述一个图中社会关系行为人的关系特征。如果一个图到另一 


和点出度)，那么这两〃 


r 应关系，维持71 
f 个图就展示了结 


图中两个节点相连，那么在第二个图中相应的两个点也必然以闻样 
相连 (Borgatti Everett , 1992:11)。每一个图自身是同构的，这就被称 


形式，也就是一对一的对应关系映射到它 自身。 当且仅当两个节点与相应的其 
他位置(伹不是同一个节点)连接时，这两个节点就是自形等价(即联合占据着 

同样的位置)。自形等价节点有相同的图论特征，比如中心度、自我密度- 

体规模 (Borgatti & Everett , 1992). 








研究计划*这个研究计划将一个经济体的行业和部门定义为生产相似类型产 
品、在跨组织网络内占据单一位置的单位集合。 Borgatti 和 Ev e rett(1992«21) 
则宣称，结构等价性单位,如果按照定义，必须要从同一供应商购买原料，产品 





必须要销售给同一代理商，实际上这不太可能组成任何符合该定义的部门，伹 
是自形等价单位，则只需要从相似的供应商购买原料，将产品销售给相似的頋 


正规等价是三个常用等价形式中条件最为宽松的一个。它既不要求结构 
等价中与相同行为人的联结，也不要求自形等价中不可区分的位置。如果行为 
人与其他也是正规等价的行为人具有同种类型的关系，那么这些行为人就是正 
规等价的。将这一想法进行概念化的另一条途径是，如果占据一个位置的第一 
个行为人与占据第二个位置的行为人进行联结，那么如果第二个行为人构成正 
规等价，則它必须与第二个位置上的其他行为人有着一个相同的联结 (White &• 
Reitz, 1983,214). 

所有拥有孩子的母亲都是正规等价，而不论她们孩子数貴的多少;反过来 
也一样。在医院里，医生与他们的患者和护士的关系，也是正规等价的，即使每 
个医生所属的病人和护士数量不等 • 正规等价的这种特性使它可能成为社会 
学家分析社会角色和位置时最为重要的工具。 

自形等价和正规等价这商种方法都要求某对行为人与其他在同一种关系 
具有结构等价性的行为人联系。伹是，自形等价和正规等价之间的区别有时也 
是模糊不 清的。 自形等价要求未标示图之间必须具有严格的可替代性,但是正 
规等价并没有要求子图之间具有完全的可替代性。 

为了解这种不同，图5,2推述了一个分等级的组织机构图。这个图由4个 
垂直的层次构成，其中的联结是监督关系 4 CEO 监督3个执行经理 (A、B、C>， 
而这3个执行经理又监督下面4个中层管理者 <D、E、F、G) ，再下层就是一些 
基层的雇员(从 H 至 N〉• 如果我们忽略雇员层，那么执行经理人 B 和 C 就是结 



、都监督着相同数量的中层管理者 (2 名）。如果我们考 
IB 和 C 也是自形等价型的，因为如果标示被移除，他们 
代的。但是， A 的子图不能被 B 和 C 的子图所替代，因 
皆只监督3个基层雇员，而 B 和 C 的子图每个都有4 





个雇员。 



如果仅仅只看两个最低层的关系，那么4个中层管理者没有一个是结构 
等价的，因为他们都监督着不同的基层雇员。然而，其中3个中层管理者 (D、 
F 和 G) 是自形等价的，因为他们各自下厲2个雇员 ，一 旦移除标签，是可以完 
全互相替代的。而 E 不闻，它只管理1个雇员。但是，如果按照监督至少1个 
雇员的标准，所有的中层管理者都符合正规等价标准。图 5. 2淸楚地显示，结 

构等价是最严格的形式，而正规等价是最宽松的形式，自形等价则处于中间。 

对于确认一般化的网络社会角色，正规等价似乎是一个非常灵活的方法，它 
宽泛地定义一个社会系统中与其他位置具有相似结构性关系的行为人阶层 
或类别。 

Logit 模型 (p*) 

大多数网络分析方法都是描述性的，试图通过数据简化技术去展现一些潜 
在的社会关系结构，或者通过代数运算来归纳出网络关系的特征。而 P* 棋型， 







二进制有向图 。 有兴趣的读者如果需要进一步学习，可以查阅上述有关文献。 

P* 模型与 logistic 回归密切相关， logistic 回归分析二分因变量(作为二进 
制变量进行编码：1或 0) ，并假定这些变量是二项式分布。如果最小二 












i^-N, 第二，虽然模型看起来像是估计对点的特征，伹这实际上是整个图的 
模型。 而且， P* 模型估计观察现在的图作为不同网络特征的函数的条件概率， 
将这些不同的网络特征(如选择、相互关系和传递性)作为自 变量。 第三，这些 
自变量的值是当从 i 到 J ‘的给定关系链由存在变成缺失时 * 整个图的变量的合 
计值的差。例如,假设在某个特定图中相互关系链的总数是5,如果两个个体之 
间的关系链存在，如从行为人4到5,然后把从4到5的关系链变成缺失，那么 
这个图中的一条相互关系链也将消失。因此，对于两个行为人（4«5)的自变量 
“相互关系”的值为1。 P* 1 模型实际上估计的是，如果关系链 0^) 是随机形成 
的，且每个有向关系链发生的概率相互独立时，观察到现在的图形的概率。 

为了说明 P* 模型，我们使用 Crouch 和 Wassennati(1998〉 中的二进制有向 
图。图 5. 3显示了 3个政府研究机构(圆圈表示)和3个私立 R&D 实验室(正 
方形表示)之间的“项目支持”关系 • 例如，政府研究机构1和2之间有相互支持 
关系。 虽然研究机构3给私立 R&-D 实验室4提供项目支持，但这个关系链不 
是互惠的，实验室4对研究机构3不提供项目支持。 








Z p = 表示变量“相互关系”， 

z Pw = E W 病表示变量“同一类型内部相互关 系”， 

z TT = ' E iik x ii XjkX i k 表示变量“传递性”。 

指标变量知是个二进制指标，当 /和） 是相同类型时，知为 




















































个例子中，平均的事件参与率是(|)= 2. 33个行为人， 
隶属网络的密度和中心度密度和中心度是非常3 











I AX A 对称矩 




to 下所示： 


这个例子中， DA = 5 
。从事件角度来看，I 






息或资源流的居间程度;特征向置中心度反映行为人与网络中的其他中心行为 
人的联系程度。 Faust(1997) 讨论了这4种中心度测量方法在隶厲网络中的运 
用，但在此由于文本篇幅的限制，我们只讨论隶属网络中程度中心度的使用。 

一般认为，程度中心度包含有向联结的总数，因此隶属网络的行为人程度 
中心度便是行为人联系的总数，即第 i 个行为人出席所有事件时所接触到的联 
结数量，由共间出席的矩阵 XA 的第£个行值相加 所得： 














点阵有两个非空集合:行为人集合 AJ 
网络连接，表示行为人是如何与亊件相连的（反之亦然）。因此，一个 Galois 点 
阵由一个三元组 (A，E, I)构 fii 其中I是矩阵 AXE 中的二进制关系。表 5. 3 
中二分矩阵的子矩阵 A 是一个行为人一事件矩阵的实例。现在考虑 P(A) = 
{Ai, Az , …}，这是一系列矩阵 A 的集合 f P(E) = {Ei, E 2 , ，这是一系 
列矩阵 E 的集合 4 I关系定义为从 P(A) 至 P(E ) 的 映射: : 

B 个={«€到(《， 《) 6 h 所有 [5.15] 

这个数学表达式表明，映射图能够识别某一特定行为人或某些行为人所隶 
属的所有事件 * 尤其是， t 映射从一系列行为人到一系列事件，其中这些行为 
人隶属于这些事件 (Wasserman &■ Faust, 1994:330)。例如，表 5. 3中的子矩 
阵 A 表示,行为人1隶厲于事件1和事件2,而行为人1和2都隶厲于事件1。 
反过来，这个映射能够从 P(E) 至 P(A)：F-F{ 

- {a €A| («,«)€/，所有 [5.16] 


國~ 


的事件，只需要向下移动，将点阵下降。依照惯例,点阵上面部分涵盖了行为人 
集合 A 的全部要素，下面部分涵盖了行为人集合 E 的全部要素。图5, 5展示了 
表 5. 3当中隶属矩阵的 Gaims 点阵图^这个图将3个事件标示为 A、B、C， 将5 
个行为人标示为1、2、3、4、5,该点阵底部聚集了最多的事件。沿着点阵向上 
移动，会逐渐遇到行为人集合的增大和事件集合的 缩小。 在底端的起始点，包 
含所有的事件 (ABQ， 但行为人集是空的(幻，因为没有人参与所有的事件。向 
上一点，点阵图显示，事件 A 和亊件 B 共享行为人1,亊件 B 和事件 C 共享行为 
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方面, Galois 点阵类似于图，其主要的运用是展示数据，而不是还原数据。大型 
数据集合，一般包含离度复杂的结构，会迅速搅乱 Galois 点阵的可视性。即使 
利用简化符号，如 Freeman 和 White(1993) 所建议的那样， )51 漆者依然很难看清 
楚复杂的 Galois 点阵的图像。 

网络小团体的 Galois 点阵网络分析者认为,一些统计的或代数的数据还 
原方法可以被用于简化 Galois 点阵的可视化图像 （Duquenne, 1996; White, 
1996). F reeman (1996) 认为， Galois 点阵能够帮助展示社会行为人之间的小团 
体。 经典的 Luce^Perry 小团体定义假定存在一个关于社会关系 R 的二进制对 
称平方矩阵 (A2) a 小团体 C 是一个含有三个或多个行为人的最大子集，其中每 



另一个三元组 (A、C 和I)，其中 A 和I的意义不变， C 表示小团体的集合， 


遵循事件的 Galois 点阵的相似布局，小团体 GaloU 点阵将较大的小团体集 
合放置在下部，将较大的行为人集合放置在上部。假定图 5. 5现在表示的是一 
个小团体 Galois 点阵，而不是一个事件 Galois 点阵，那么在底部有3个小团体 
ABC， 其零值表示没有行为人属于这3个小 团体。 沿着点阵往上走，我们可以发 
现，小团体越少，行为 A 慮合 越大。 行为人1同时属于小团体 A 和 B, 而行为人5 
同时厲于小团体 B 和 C。 继续往上走，可以看到小团体 A 包含行为人1和2,小团 
体 B 包含行为人1、3和5,而小印体 C 包含行为人4和5,行为人的全体集合位 
于图的顶端，是个空集，表示没有一个小团体同时包含所有5个行为人， 


Fr e eman(1996) 讨论过小团体网络 Galois 点阵的几个重要结构特征。首 
先，两个重金小团体由下降线连接，交会于点阵图低处某个标签点，而两个非重 
叠小团体则仅在无标签泛下限处与空集 (f) 连接。假设图 5. 5反映的是一个小 









它们的交会点是在无标签的泛下限点。 

其次， F r eema n (1996) 利用多种重要维度（比如链、长度、高度和深度），对小 
团体点阵的个人行为人的位置按特点进行了归纳。链是指由一个元素引至另 
一个元素的全部上升线或下降线所组成的序列。链的长度是链所包含的线条 
的数量 • 行为人的离度是从泛下限点上升至该行为人处的链的长度，相反，行 
为人的深度是从泛上限点下降至该行为人处的链的长度。因此,处于点阵低处 
的行为人具有较大的深度和较小的高度，而处于点阵顶部的行为人具有较大的 

高度伹是较小的深度 • 深度较大但高度较小的行为人深嵌在网络中》他们参 

与多个小团体，但他们与这些小团体的隶屑关系独立于其他行为人的隶属关 

系。从某种意义上来说，他们构成了这个小团体的核心成员。相反，高度较大 
但深度较小的行为人则往往浮在网络表层。他们与某个小团体的隶属关系往 

往取决于其他行为人的隶厲情况。因此，他们厲于这个小团体的边缘人物。将 

这些观点套用于图 5. 5,我们就能够确定行为人1和5分别是小团体 AB 和 BC 

的核心成员，而行为人2、3和4则是这些小团体的边缘人物。 

对应分析上面讲的点阵分析是运用代数方法展示隶属网络的代表，而对 
应分析则利用度*技术来联合展现隶属网络中所有的行为人和事件 (Faust, 
2005, Wasserman & Faust, 1994:291—343)。对应分析主要通过奇异值分解 
(SVD) 的数学方法进行 4 我们这里只简要地介绍一下 SVD， 集中谈论与隶厲网 
络矩阵有直接关系的几个事项(如欲知详情，请参阅 Strang, 1988). 

SVD 是矩阵 A 的分解，其维度有 gXh： 

A = X A VT [5, 17] 

这个方程含有 A ，它表示奇异值的对角线矩阵 <； Ik hX 表示大小为 gXk 的 
左奇异向量矩阵 *Y 表示大小为 AXA 的右奇异向量 矩阵。 因此，左奇异向量指 
矩阵 g X A ，右奇异向童指矩阵 hXh. 竒异值的数量也被称为秩，通常表示为 
W. SVD 利用秩 W 来度量视图中的行为人和事件，将它们排列在 A 的合适位 
置中。 





















事件的值吗？ 

图 5. 6给出了隶属网络的对应分析。栝号内的数是2个维度的值,等于表 
5.5 中的数，X轴和 Y 轴分别表示第一和第二维度 (A) „在图中，行为人1隶属 
于事件1和亊件2,行为人5隶属于亊件2和事件3,处于2个维度的中心，因此 
位于图表的中央。事件2位于第一维度的中心,主要是因为它吸引了大多数行 
为人(1、3和5)，但是它离第二维度的中心要比事件1和 3( 每个事件只吸引了 
两个行为人)远一点点。行为人3位于第一维度的中心，因为它隶属于中心亊件 

(事件 2) ，但是行为人3在第二维度中的位置却是最边缘的，也许是由于它只参 

与了一个亊件。行为人2和4在2个维度中都处于边缘，反映他们只参与了一 

个事件。同样，事件1和事件3在2个维度中也是位于边缘，表明它们比事件2 
吸引的行为人要少一^。 

















如, Han(2003) 利用加权 MDS 法,分析了 1993年综合社会调査数据中受访者的 
音乐爱好。虽然收集社会网络数据耗时费力，尤其是采用全幢网络设计时， fe 
社会调査数据却比较容易获得，可以用这些网络分析方法对它进行分析，以揭 
示潜在的关系。社会网络分析为研究者提供了有力的分析概念和工具方法。 
最近有一项研究非常娴熟地运用了聚类分析方法，将中欧东部地区1586个市民 
社会网姑根据13个变量分类成6个维度 (Vedres，Bruszt &• Stark, 2004), 另 
一项研究 (Mohr，1998) 則直接讨论如何将 MDS、 聚类和对应分析等方法用于 
对复杂结构进行简化，对不同文化背录之间的一些深层结构逻辑进行可视化处 
理。这些研究展现了多种社会网络方法的熟练应用，也正好表达了我们本书所 
追求的最终目的——敢励读者朋友努力学习社会网络分析，以洞悉结构关系 
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统计方法与应用阿题 
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本书扩展了 Jae^On Kim 和 Charles W. Mueller 的专著<因子分析 导论: 它是什么以及 

如何运用》 (.tofrcyucto7 to factor analysis ： what itis'and how':t<xe^..it)。 后者着 S 对因子 ■ 
奋析技术 i 础的介绍，关心的是“为什 $ 进行因子分析”这个问题,并且希望读者询问运 
用这种方法涉及 P 些假定。 

对阅读使用因芋分析方法的书或文章，或者用自己的数据来简单试用因于分析方法 
的读者来说,本书将把他们引导到另一个阶段。在书中, Kik 和 Mueller 用更为明确的数 
据分析例子，更为详细地介绍了因子的不同方法，以及它们在何种情况下最有用。 
验证性和探索性因子分‘析的差别在这里会比在《因子分析导论 :它是 什么以及如何运用》 
中讨论得更深入，同样会进行讨论的还有因子旋转的各种标准。特别值得一提的是对不_ 
同形式的斜_转的讨论，以及如何解释从这些分析中得到的各项系数。 Kim 和 MUeller^ 
答了在探 i 性因子分析中抽取出的因子数量的问题，讨论了在验证性因子分析中检 
验假设的方法。对于这些研究中抽取出来的尺度得分，他们也讨论了分析它伯时会遇到 
的问题。本书会提供一份译名对照表，同时还会解答使用因子分析技术的人经常提出的 
一些问题。读者可能会被其中一些问题的回答所困扰，但只要加以注意，分析者就能避 







正如作者所指出的，本书不可 能涵盖 因子分桁的所 斉方面 ，因为在这个领域里经常 
会有新的发展。然而，如果读者能够建立起系统性的知识，知道如何运用这种技术，以及 
我们实际上至少在先形中做了什么假定，那么本本就已经达到其目的了。 


斯拉纳 （E_ M. Uslaner) 



导论 



在很大程度上都只是表面的。实际上，有一些共同的线索贯穿于这些差别 。更 
重要的是，研究者会发现，对相间的数据运用不同的方法和标准，在大多数实际应 
用中其结果是一致的。简而言之，读者没有必要立刻学会和使用所有的选项。然 


而，重要的是使用者要知道进行因子分析时最重要的差别和选项，并且使用者从 
一开始就要明白，对大多数问题我们没有绝对唯一的(或者最好的)解决方案， 










本书假定读者对因子分析的概念基础有基本的认识，那些内容在上一卷书 
中已经介绍过。我们也希望读者明白以下两种内在的不确定性之间的区别，即 
从观察到的协方差结构推论潜在的因果结构的不确定性①(逻辑问題〉，以及从 
估计的样本统计量推论总体参数的不确定性(统计问题)。尽管这两个问题在 
竞的因子分析问题时有内在的联系，但在头脑中要分淸这两者之间在概 
L 在讨论统 i 十方法与实际问題之前，我们有必要简单复述一下第一 
卷所介绍的 内容。 


解决实际的因子 
念上的差别 • 在 


对因子分析基础的回顾 

因子分析假定我们观察到的变 S 是一些潜在的(假设的或者未被观察到 
的)因子的线性组合。这些因子中有一些被假定是两个或更多变量共同的因 
子，另一些被认为是各变貴独有的因子。这些独有的因子被进一步假定为(至 
少在探索性因子分析中)互成正交关系》因此，这些独有的因子对变量之间的 
共变关系没有贡献。换言之，只有共同因子(被认为在数童上要远比观察到的 
变量少)对观察到的变量之间的共变关系有贡献。 

因子分析中假定的线性系统是这样的，如果我们知道潜在的因子负载，就可 
以准确无误地识别出协方 整结构 a 然而，要从观察到的协方差结构中弄淸楚潜在 
的共同因子结构却比较困难，这些基本的不确定性跟统计估计没有关系，且必须 
在统计以外的假定的基础上解决，它们包括因子因杲关系的假定和关于简洁的 
要求. 

在这些假定和线性系统的特性下，我们可以研究所得到的协方差结构，准 
确识别出潜在的因子模式，只要潜在的因子棋式相对简单，且满足简单因子结 
构的要求。例如，图 1. 1所示的两个常见的因子模型在第一卷书中也展示过，它 
可以用表 1. 1中下三角区内无误差的相关矩阵恢复得到(在第一卷书中，我们指 
出用最大似然因子分析法得到结果后，再用基于直接最小斜交法的斜交旋转， 


















因子分析主要用于探索或者验证，取决于研究者的主要目的。在两种应用 
中，准备合适的协方差矩阵、抽取初始的因子、旋转以获得最终结果这三个步骤 
都会涉及。虽然要获得最终结果并不总要遵循这些步骤(尤其在检验特定的假 
设时)，但通过这些步骤来讨论因子分析的主要变型会比较方便。因此，本书的 
第一部分主要围绕这些步骤来展开 s 

在第一卷书中,我们已经指出在选择基本的录入数据时有一个重要的选 
项一是用普通的变量之间的协方差(或相关关系），还是用各实体的相似描 
述。迄今为止，我们的讨论都集中在前者，此处也会这样。 

在因子分析的最初步骤中，我们有共同因子模型，它作为我们的参照棋型， 
也有主成分分析，它背后的原理跟“共同”因子分析不同。伹它们都是广为运用 
的有效方法，都是探索变童之间“相互依赖关系”的工具。这两种方法的基本差 
别，在于主成分是观察到的变量的某种数学函数，而共同因子则无法用观察到 
的变量的组合表达出来。在因子分析的最初步骤中，另一种方法是映像因子分 
析法。映像分析跟共同因子分析的不间之处在于，共同因子分析把观察到的变 
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量看做是潜在无限的总体中的一个样本，而映像因子被定义为变量的线性组 
合。本书会更详细地解释这些方法的异同。此外，如果用的是共同因子模型， 
实际上也有很多方法来抽取最初的因子。在本书中会介绍到的抽取方 法有： 
(1>最大似然抽取法(包括饶氏正则因子分析法)， （2) 最小二乘法(包括最小化 
残差法和带迭代公因子的主轴因子分析法）， （3) Alpha 因子分 析法。 Alpha 因 
子分析法可以看做是共同因子模型的一个变型,也可以看做是另一种方法。 

因子旋转这个步骤包括两个主要选项，即正交旋转和斜交旋转，斜交旋转 
又可以继续细分为对因子模式矩阵的负载进行直接简化，以及对参照轴的负载 
进行间接简化 * 在以上各选项中又有其他的变型。它们中的大多数将会在后 
面的章节中 谈到。 

接着，在下一章中我们将讨论应该抽取和保留多少个 因子。 本书在抽取方 
法的章节以外特意再安排这样的一章，目的在于介绍一些“经验法则”，以方便 
实际应用者。 

验证性因子分析这章的内容很基础。我们会给读者介绍一些一般性的用 
实证材料来检验因子分析模型的概念，并提供两个简单但很重要的验证性因子 
分析的例子。 

然后，我们会讨论如何建立因子尺度以用做其他研究 • 我们把它放在验证 
性因子分析之后，是因为建立因子尺度在某些方法上的不足可以通过验证性因 
子分析来缓解。 

在最后一章中，我们用一种问答的方式涵盖了许多问题。这些问题要么在 
正文中没有提及，要么非常重要，所以值得复述。在这一章我们也会对一些尚 
未形成共识的问题提供实践中的建议。 

本书最后的名词解释不是为了给各个术语提供精确的技术定义，而是为了 
方便说明它们在本书中是在怎样的上下文情录中被使用。最后,本书的参考文 
献不是为了反映这个领域的历史发展，或对其创新给予足够的称赞。我们引用 
了我们对该领域所了解的有价值的文献，读者应该以同样的精神来使用这些文 
献。我们希望没有冒犯那些对因子分析的发展作出了贡献，却没有被我们引用 
的学者》 





第 2 章 I 抽取初始因子的方法 


在探索性因子分析中，抽取因子这个步骤的主要目的是决定共同因子的最 
小数量，这些共同因子能够产生可观察到的令人满意的变量间的相关关系。如 
果没有测量误差和抽样误差，且在数据中对因子因果关系的假定是合适的，那 
么在产生一个相关矩阵所需要的共同因子的最小数量和调整后的相关矩阵的 
秩之间就会有完全对应的关系(调整相关矩阵要求在其主对角线上插人公因 
子)。 也就是说，在没有抽样误差，以及因子模型跟数据完全吻合的情况下， 
我们可以通过研究澜整后的相关矩阵的秩得到公因子(实际值，而不是估计 
值），也可以得到共同因子的数置。然而，如果存在抽样误差，就不能依靠秩 
理论了。这时候的目标是在存在抽样误差的情况下，用一些准则来决定共同 
因子的数量。正如在《因子分析导论:它是什么以及如何 运用》 中讨论过的， 

决定共同因子的最小数量的最终准则，是这些被选定的共同因子能在多大程 

度上重现观察到的相关关系。因此，这个目标可以被重新表述为解决一个统 

计问题，即寻找一个决定我们何时停止抽取共同因子的准则。遵循标准的统 

计逻辑，它涉及到在什么情况下，我们认为重新生成的相关关系和观察到的 

相关关系之间的差别可被归结为抽样变异性。 

我们从描述在多种抽取方法中一致的基本方案开始，其中包括假设用于重 
新生成观察到的相关关系所需的共同因子的最小数量。在没有任何信息的情 
况下，这意味着从一个共同因子的棋型开始。这个“假设”通过运用某些标准来 
判定选取的模型与数据之间的差异是否微不足道。如果不是，我们将增加一个 
共同因子，运用同样的准则再对模型进行估计。这个过程将不断持续，直到它 
们之间的差别被认为可被归结为抽样误差(读者应该回顾《因子分析导论:它是 



















分析:方 as 与皮用 ^題 I 


什么以及如何运用》的第 2 章，在那里我们假定没有抽样误差，其准则就是选取 
的模型与数据之间的差别为0)。需要指出的是，实际运用的运算法则也许不能 
真正地进行这种连续的判断，但抽取初始的 A 个因子以解释我们观察到的共变 
关系的这个原则仍然是成立的。 

虽然这个基本方案在原则上很直接，但它的应用却可以有无数种形式，因为 
有很多最大拟合(或最小差异〉的标准。跟我们迄今描述的共同因子模型非常一 
致的两种主要方案是:（1)最大似然法 （Lawley and Maxwell, 1971, JOreskog, 
1967； Joreskog and I^wley, 1968), 它的变型包括正则因子分析法 (Rao, 1955)，以 
及基于最大化残整偏相关矩阵的行列式方法 (Browne, 1968) K2) 最小二乘法，它 
的变型包括迭代公因子的主轴因子分析 CHiomson， 1934〉和最小化残差法 
(Harman, 1976)。此外，还有另外三种主要的抽取因子方法:⑴ Alpha 因子分析法 
(Kaiser and Gaffrey, 1965)，⑵映像分析 (Guttman， 1953, Hams, 1%2)，⑶主成 
分分析 （Hotelling，1933). 我们将首先描述* B 提到的这个方法。 

主成分，特征值和向量 

我们之所以从讨论主成分分析开始，有两个原因。第一，它可以作为一个 
基本棋型，我们可以用它和共间因子棋型进行比较;第二,通过它很容易推述一 
些难以解释的概念，例如特征值和向量，以及它们在因子分析运算中的角色(我 
们并没有放弃依赖最简单的运算法则这个目标，但是对这些术语有一定程度的 
熟悉，对许多 it 奠机程序的使用者来说是非常必要的。在此强烈建议读者看完 
以下的基本介绍)。 

主成分分析是将我们观察到的一组变量转换为另一组变量的方法。为了展 
示它的特点和潜在的逻辑，最简单的方法是在双变量的情境下进行研究。假定有 
两个变量， x 和 y, 为了介绍上的方便，我们也假定它们的分布是二元正态分布》 

图 2. 1用 轮麻图 描述了中等程度的正相关的二元正态分布 关系。 这些图显 
示，因为 x 和 y 有正相关关系，数据点的集群表现为 x 的较大值与 y 的较大值 
相关(反之亦然)，因此大多数个案都集中在第一和第三象限，而不是第二和第 
四象限。这些轮應图形成椭圆形，它的两条轴用虚线表示。主轴(朽）通过大多 




假设我们现在的工作是只用一个维度或一条轴来表示每个个案的相对位 
置。对这个参照轴的合理选择是朽，因为从整体上来看，在某种意义上该轴跟 
数据点最接近 * 第一个主成分因而只是主轴上的个案的代表*举例来说，如果 
个案在X和 Y 上取值都为1， 在朽 上将表示为大于 1,而在 p 2 上则表示为小于 
1。如果我们对每个个案都用 Pi 和 P2 表示(用坐标系中的点），就不会有倌息 
上的损失，从而我们珂以对每一个案进行准确推述，而且不必考虑 x 和 y 的关 

系。然而，当 x 和 y 的关系变得更强时，我们可以说第一条轴(和第一个成分） 

在播述个案方面侑息量更大。在极端情况下，如果 x 和 y 是线性函数关系，那 

么第一个主成分就包含了描述任何一个个案的所有信息。如果 x 和 y 之间是 
独立的，就不会有主轴，使用主成分分析就不能帮助简化问题。 












-且第一个成分被定义为包含最多的信息(它解释了数据中最大的方差）， 
第二个成分也用相似的方式定义，此外还有一个条件是它要垂直于第一个成 
分。因此，在两变量的情况下，一旦确定了第一个成分，我们就自动得知了第二 
个成分。另外要记住的是，除非 y 是叉 的线性函数，或者相反，否则就有两个主 
成分(我们需要用两条轴来完整地描述该联合分布)。 

在获得主成分的过程中，我们不需要假定存在假设性的因子。新的轴是观 

察到的变量的数学函数。尽管主成分分析是用于获得表现上的简约(在只研究 

前面几个成分来说是如此)，但它的目的不是解释变量之间的相关关系，而是尽 
可能解释数据中的方差。另一方面，因子分析性的分解只要求一个因子(在此 
两变量的情 况下〉 ，且主要的目标是解释变童之间的相关关系 • 总而言之，前者 
(主成分 分析〉 以解释方差为目的，后者（因子分析性的分解）以解释协方差为 
目的。 

当有两个以上的变量时，界定主成分的基础是一样的*举例来说，在三元 

正态分布中，三维的轮廊图会与一个有些许扁平的足球相似(椭球 ）> 第一条主 

轴穿过一个顶端到另一个顶端，因而成为最长的线;第二条轴穿过第二长的距 

离,同时垂直于第一条轴(这是由于扁平而变宽的部分 h 第三条轴将是最短的， 
它会穿过由于扁平而变窄的部分 • 

为完成这祥的层级分解或转换的数学方法被称为特性方程或特征方程。 
解这个方程将得到銀一个矩阵有关的特征值和特征 向量。 这个特性方程有以 
下的形式(用矩阵符号表示）： 


其中尺是我们要获得的矩阵，V是我们要确定的特征向量， A 是一个特征值•解 
决方法最终要靠以下形式的更简单的行列式方程： 

Det(J? -IX) =0,它将转变为一个双变量矩阵 [2.2] 


o 











I ^ 


此外，注意特征值的和等于变量数，即 Ai +妇 =(l+ra 2 )+<l — m> = 2， 
特征值的积等于相关矩阵的确定因素，即 CAiKAz) - (1-4). 这些厲性对各 
种大小的相关矩阵都成立 a 然而，最重要的是，最大的特征值代表第一条主轴 


使用相关矩阵时)特征值的和等于纳入分析的变置的数量，将第 
^ W (变量数)，我们也可以得到给定的轴或成分所解释的方差的 



长度为因而，主成分的负载可通过把特征向量乘以相应特征值的平方根得 
到，这就正确地反映了相应数据所解释方差的多少。 

《因子分析导论:它是什么以及如何运用沖表 2 和表 3 提供了一个两变童 
(一个共同 因子〉 的棋型，它是最简单的主成分分析的例子。特征值(按降序排 
列)是 1. 48 和 0. 52, 它们分别等于 （1 + n2 ) 和 (1 — ru), 相关的特征向量分别 
















: : 8 •这些并不 * 严格 a 

因此’成分分 t 


卜析的目的跟因子分析有很大的不同。然而，我们还是希望重 


复一下为什么我们要花费那么多篇幅在这 上面。 首先，主成分分析法经常被认 
为是因子分析的一种变型。其次，(后面会讲述的〉主轴因子分析运用相似的运 


算方法(特征方程），如果有成分分析的知识，介绍因子方法会更容易。最后，最 


重要的是，成分分析所产生的一个统计量，将作为实际运用最广泛的、解决因子 


数量问题的方法（它指的是“特征值大于1”的标准，我们将在后面谈到这个 


问 题〉， 


共同因子模型的变型 






























det(R2-A/) = 0, [2.10] 


R2^U~ 1 [ 2 * 11 ] 

=U-iRiU" 1 [2.12] 

此处 U2 是在各个步骤中独有方差 M 估计 fiL 方程 2. 10和方程 2. 4的不同之 
处在于，它用调整后的矩阵1? 2 代替 R ，并在每次迭代中重新调整;它和最小二 




















假设开始，直到显著性检验表明我们得到的模型没有显著地偏离观察到的数 
据。 尽管这些连续的检验并不互相独立，而且使用它们的时候也不必有太多顾 
虑。 (Uwley &• Maxwell, 1971). 

然而，在实际应用中，当样本量较大时，如果我们仅仅依赖于显著性检验， 
就会遇到一个问題，即我们得到的模型中的共同因子数置比我们预期的更多。 
此外，因子模型只是对现实的近似表现，所以模型和数据之间如果有拟合上的 
细微问題，就有可能产生一个新的显著的因子。在第4章中我们将会再次讨论 
关于如何决定因子数量的一些问题。 

Alpha 因子分析法 

无论是最小二乘法还是最大似然法，它们都假定我们考虑的变量构成了总 
体，而且涉及到的抽样只是对个体的抽样。然而，在 Alpha 因子分析法中，包含 
在因子分析中的变量被看做是变暈总体的一个样本，同时假定这些变量在一个 
给定的由个体组成的总体中被观察到。因此，在 Alpha 因子分析中，重点是强 
调心理测量的推论，而不是通常的统计推论。 

Kaiser 和 Caffrey 认为这个方法基于一个原则,即我们抽取出来的共同因 

子与相应总体中存在的共同因子有最大的相关性，由此而决定因子负 


栽(1965:5)。 

对这种方法的另一种理解是把独有的因子看做是心理测量抽样中产生的 
误差。 由此，对公因子的估计被看做是在测量背景下的“信度”，作为第一步， 
这种方法首先产生4修正了“寰减”后的相关 矩阵： 

R 3 = H~HR-lfl [2.15] 


此处 U2 和分别是独有成分和公因子的对角矩阵是一个对角矩阵，它 
包含公因子的平方根的倒数)。然后与这个“修正了”的矩阵相关的行列式可以 
用通常的方程来解 s 


det(jRs —XI) = 0 


[2.16] 














被定义为由一•组变量中除这个变量之外的其他所有变量的线性组合所预测的 
部分，它被称为该变量的映像《变量的独有部分是这个变量中不能被其他变量 
预测的部分，它被称为反映像。在进行这种分解时，我们假定处理的是变量的 
总体和个体的总体，闻时没有对它们中的任何一个进行抽样。 

映像分析也假定这个变量的总体是无限大的6为了便于比较，我们回到图 
1.1 所界定的两个共同因子的棋型。在那个模型中被界定的6个变量构成了某 
种意义上的 总体。 但是在映谭分析中，这6个变量应该被视为一个无限大的变 
量总体中的样本，它跟两个共同因子所覆盖的心理测量维度有关。 

然而，如果研究潜在变量总体中的所有变量，我们可以发现，一个变量的映 
像的平方就等于共同因子分析中所定义的变量的公因子，一个变 置的反 映像的 
平方就等于独有方差(在这里我们假定所处理的是标准化后的变量)。换言之， 
一个变量与该变量所属的变量总体中其余变量之间多重相关系数的平方跟该 
变量的公因子相等 • 

一个变量样本中的映像和反映像分别被称为偏映像和偏反 映像。 尽管 
偏映像只是近似于总映镓，伹它完全是被观察到的变量所决定的。从这个 
意义上讲，它和共同因子分析有很大的不同，在共同因子分析中变量的共同 
部分被定义为假设性因子的某种线性组合，且从来不是观察到的变量的确 
切函数。 

给定一个变量的样本和它们之间的相关关系，映供分析能建构出一个 
偏映像协方差矩阵，它可以表示为 

Ri = (R-SZ)R-i(J?-S2) [2.17] 
在此是相关矩阵，穸是对角线矩阵，它的元素是各变量中不能被其他变量 

解释的方差——或者说是反映像方差 • 在方程 2. 17中涉及到的过 程是： 

(1) 把1?的对角线替换为各变量与其他变量的多重相关的平方〆 2) 重新调整 
对角线以外的元素，由此得到一个 Gramian 矩阵 4 然后把特征方程应用到以 
下的矩阵： 


det(J?4 —Al) = 0 


[2.18] 











第 3 章 I 旋转的方法 


因子分析的第一步,通常是决定要充分解释观察到的相关关系所需的最少的 
因子数量，在这个过程中也决定各变置的公因子。因子分析的下一步是通过旋转 
寻找更简单和更容易解释的因子，同时保持因子数量和各变量的公因子不变。 

上一章讨论的所有方法都可以生成初始因子，它们是垂直的关系，并且按 
照从最重要到最不重要的顺序排列。因子分析结果的这两个特点并不是数据 
结构中内在就有的 > 它们是对数据的强制限定，以使最后的结果唯一且在某种 
意义上可被 限定* 进行这些强制限定，其结果是 :（i) 无论潜在的真实模型怎 
样，变量的因子复杂性都可能大于1，也就是说，变量会在超过一个因子上有相 
当程度的因子 负载; (2) 除了第一个因子，其他因子是有两极的，也就是说，在一 
个因子上某些变量有正的负载，而另一些变量有负的负载(如果读者看不懂这 
些推述的意义，可参看第一卷书的第2章，并考察一些因子棋式乂 

目前有三种方法可以解决(因子)旋转的问题，第一种方法是像我们在第 
一 卷书第2章讲过的那样，通过作图研究变董的模式，然后旋转数轴或者定义新 
的数轴，使得新的数轴能最好地满足我们的标准，即结构简单又有意义。当存 



者来说这样的图像旋转并不实用。 


第二种方法是依靠一些分析性的旋转方法，至少在选择了是否达到简单化 

的判定标准后，它们不依赖于主观 判断。 这个方法有两种不同的亚类型- 

种是正交旋转，另一种是斜交旋转，在各亚类型中又有很多不同的变型，但在 
本章中我们只介绍几种众所周知并广为应用的方法》 













的因子复杂性都是 1 —即各变量只在一个共同因子中有不为0的负载，因子 
结构就是最简单的。如果有2个或2个以上的共同因子，就意味着在最简单模 
式的矩阵中:(1)每一行都只有一个不为0的要素;(2〉每一行都有一些 0^(3) 对 
任何两个列，不为0的要素不会重叠。 












我们只是说明当存在 2 个以上的因子，且变童并不像人为数据那样明显呈丛时， 
确定参照轴的方法，并把这些参照轴在下一步或迭代中看做垂直的轴，从而能 
够帮助我们找到一个拟合得更好的 主轴。 在这里重要的是，记住旋转的基本目 
标始终是寻找一个因子模式矩阵，使之最接近于前面提到的最简单的理想 
结构。 

正交旋转的 方法： 四次方最大法，最大方差法和均等变化法 

由于我们假定读者在实际分析数据时要依赖于现有的因子分析的计算机 
程序,因此我们只推述每种方法背后的基本原则。在前一章中，我们介绍了在 
给定 k 个共同因子和 n 个变量情况下的最简单的 结构。 在这里总结一下这种 
矩阵的分析性属性是很有必要的。 

因为一个变量只在一个因子上有负载，因此对变量的因子解释是最简单 
的。但那样的特点并不足以用数字表示它的简单程度。其中一种对简单程度 
的数学测量是每行(或每个变量)的因子负载的平方的变化程度(我们考虑负载 
的平方只是为了避免处理负载的正负号问题)。因为方差被界定为与均值的离 
差的平方的平均值，如果其中一个元素的负栽的平方等于公因子，且行中的所 
有其他元素都为0,(对固定数量的因子和固定的公因子来说)这时方差将是最 
大的。简而言之，一个变童的因子负栽的平方的最大方差等于该变量因子复杂 
性的最简程度。因而，将因子简单程度的概念数量化是合 理的： 





中减号后面的部分仍固定，是因为 

由此，简单程度的总测置就可以通过计算所有变童 qi 的总和而得到： 

运用四次方最大标准会得到因子负栽最小化 q 的旋转轴。然而,最小化 q 
等于最大化以下项， 


Q= C3.4] 
因为公式 3. 3中的其他项都是常数。因此，它被称为四次方最大法。 

实际上，运用这个标准可能导致强调变量解释的简单性，但损害了因子解 
释的简单性。尤其是在涉及较少共同因子的时候，一个变量的解释也更简单， 
而如果相对较少的变量在因子上有很高的负载，且其他变量在其上没有负载， 
因子的解释就更简单。总的来说，四次方最大原则倾向于某个一般性因子在一 
裝$置上有中等或较少负载的情况下产生最终的结果。 

最大方差旋转法用一种稍微不同的标准来简化因子矩阵的各列。它最大 
化各因子负_的平方的方差，而不是最大化变量负载的平方的方差》要最大化 
的量一 "因子 j 的简单性指标为： 


nEM-(Sb |) 2 

vj=- ^~^— [3.5] 

注意现在是计算 ti 个变量的总和，旦跟公式 3. 2中的相应项不同，减号后面的 
(§ 螭）不固定。对其简单性的总测置为 




[3.6] 







n 用正态化后的因子负载以 
式 3. 6 中我们用 b§/ 纪代替 


在表 3. 1中我们给出了用四次方最大法和最大方差法 (正态 化后)对相同的 
数据进行旋转的 结果。 在这里我们要指出，尽管四次方最大法在分析性上比最 
大方差法更简单，伹最大方差法对因子进行了更淸晰的区分。总的来说， Kaber 
的实验 (1958) 表明，对不同子集的变量进行因子分析时，用最大方差旋转法得 
到的因子棋式比用四次方最大法得到的更稳定。 









准，当 y = r/2, 它被称为均等变化法>当 y= 0. 5,它被称为二分四次方最 
大法。 


斜交旋转的方法 

斜交旋转比正交旋转应用得更广泛，因为它不对因子强加限制，即不要求 
它们不相关。它相对于正交旋转的优势在于，在进行斜交旋转后，如果得到的 
因子是正交的，我们就可以确定其正交特性并不是人为设定旋转方法的结果。 
然而，因为斜交法引人了因子之间的相关，因此对因子分析进行解释时另一种 
复杂性又出现了 # 尤其是我们可能要假定髙阶的因子因果关系来解释因子之 


利用主模式矩阵，因为我们在前面的章节里讨论了获得简单结构的总原則，所 
以在此对它们的描述将尽可能 简单。 



参照轴有投影，而在其他参照轴上投影为0。因此，跟四次方最大法的标准类 
似，我们可以定义四次方最小标准： 


C3.9] 

在此邱和 aik 是在第 i 条和第 k 条参照轴上的投影。如果所有变量都是单因子 
的，这个值会是0。但我们在斜交旋转中要得到的是能够最小化 N 的因子负载。 
在正交旋转中，这个标准等同于四次方最大法。 

对应于正交旋转法中最大方差法对四次方最大标准的修改，这里有最小协 
方差或二分四次方最小 标准。 在这里要最小化的值是在参照轴上的投影的平 
方的协方差： 







次方最小标准倾向于产生更多的斜交因子， 

由于两种标准有相反的倾向，因此结合它们就很自然。最一般化的方 
法为. 

B => « N +^ C/n = 最小，在此《和沒是要加的权重， N 和 C 由前面的公式得到。 

C 3. ll ] 

将公式 3. 11乘以 n ， 合并同类项，且设7 =皮 (《+ 卢)，我们得到一般的最小斜交 
标准： 

B = [3.12] 

当 y 的取值不同时，这个一般化的标准有变化： 

当 y = 0 (斜交最明盤> 时，为四次方最小标准； 

当 y = 0,5 (斜交不那么两显)时，为二分四次方最小标准》 

当 y = 1 (斜交最木明显)时,为最小协方差标准。 

这里再提醒一次，通常我们用 a |/ 纪代替一，使用正态化后的最小斜交标准。 

另一个与发展最小斜交法过程中界定的原则紧密相连的标 p ，是二分正态 
最小标准，但它基于完全不同的算法。它尝试对公式 3. 12中的 y 进行更客观的 
选择，修正四次方最小法“过于斜交”和协方差最小法“过于正交”的 偏误。 如果 
数据特别简单或特别复杂，相对 于連择 y 为 V 2 的二分四次方最小法，二分正态 
最小法被认为更理想。 


近年来， Jetmrich ; 




D -[3.13] ① 
在此 ba 是棋式矩阵中的因子负载， D 和 B 之间的细微差别是在 D 中有除以 n。 
跟间接的最小斜交法一样，研究者可以通过选择公式 3. 13中的 d 来修改最终结 
果的斜交 程度。 

一般来说，如果 d 值越大，产生的结果斜交程度就 越大: d 值越小(为负），则 
产生的结果正交程度越大。如果因子模式是单因子的(可能的最简单的模式）， 
<1 = 0就能界定正确的模式。 

在这里有必要提醒一下。公式虽然相似，但我们并不淸楚在直接的最小斜 
交法中 d 的选择与间接的最小斜交法中7的选择之间的对应关系。为了更清楚 
地了解界定不同的 d 的影响，读者可以参考 Harman 的书 (Harman，1975). 

其他斜交旋转法 


最大斜交标准 （Saunder，1953) 尝试通过最大化小的和大的负栽的数 
量，牺牲中等负栽，从而简化结构。作为一种客观的标准，它的方法是寻找 
将双倍的因子负载的峰度最大化的结果(这个翻倍通过将各负载计算两次 

而达到，即按负载的原符号计算一次，按负载相反的符号再计算一次)。这 


个标准和正交旋转法中的四次方最大法一样，但它在不限制数轴正交的情 
况下会得到与四次方最小法（四次方最大法在斜交旋转里的对应方法）不同 


的结果。 

同时还要提一下另外两种旋转方法。目前被广泛应用的 Harris 和 Kaiser 
的正斜交旋转法 (Harris Kaiser, 1964), 及另一种可能的选择一最大平面 


①原书中为。= ，豈 [gb!i4-d(|^|ji4)/ n ], 怀疑 有误. 一译者注 






法 (Cattel & Muerle, 1960, Eber, 1966) ，这种方法基于一个跟前面提到的所有 
方法都不太相同的拟合标准。 


旋转至目标矩阵 

除了运用旋转方法得到有分析性定义的简单结构外，有时候更理想的是旋 
转因子以拟合特定的、研究者头脑中巳有的或者假设存在的简单结构， 

第一种可能是，研究者给定了在各变量上的确切负载，根据最小二乘标准， 
通过限制或者不限制正交来进行旋转，使给定的矩阵和旋转后最后得到的因子 
矩阵之间的差别①最小。这种旋转通常用来研究一种因子结构和另一种已知的 
或在其他地方展现过的因子结构之间的一 致性。 

第二种方法被称为最优斜交旋转法，是一种通过利用正交旋转结果的某种 
函数作为目标矩阵来得到斜交旋转的方法 (Hendrickson &■ White, 1964)。最 
优斜交旋转法背后的原理是，正交旋转的结果通常跟斜交旋转的结果相似，通 
过将小负载减少到接近0,我们可以得到一个相当 好的简 单结构的目标矩阵。 
然后通过给这个目标矩阵寻找拟合得最好的斜交因子，我们就可以得到理想的 
斜交旋转结果》另外还有不同的获得目标结构矩阵和目标模式矩阵的运算方 
法，伹在这里我们不进行介绍， 

第三种也是更常用的方法，是利用一个没有前述的目标矩阵那么明确的 






SI 再论因子数量的问题 


尽管我们之前研究过初始因子分析的几种方法，其目的是寻找符合数据的 
最小数量的因子，但是有几个原因促使我们重新研究这个 问埋。 第 一 ，在讨论 
初始因子分析方法时，我们实际上假定了可以无异议地解决因子数量的问題， 
因此也没有讨论跟这个问题相关的技术点。第二,部分初始结果并不是回答这 
个问題的理想工具，因此需要重新研究旋转后的结果。第三，我们不得不解决 
由于因子分析模型和数据之间不完美的拟合所造成的问題。第四,大多数现有 
的计算机程序会要求使用者提供关于因子数量问题的信息，我们希望为读者应 
对这种情况作好准备。 

解决因子数量的问題通常有几个原则。其中一些是替代性的选项,另一些 
则是可以互 补的。 最重要的原则是: （1) 与最大似然法和最小二乘法相关的显 
著性 检验; ⑵各种特征值准则; (3) 实质重要性的准则;⑷碎石 检验; ⑸可解释 


检验显著性 

纯粹从统计角度来说，如果方法所要求的假定都成立,那么与最大似然法 
相关的大样本卡方检验是最理想的方案。应用这个方法的结果显示，如果样本 







体棋型上运用最 合适。 也就是说，它是解决抽样变异性有效的方法，但如果模 
型设定了小的偏误，它就不是最好的方法。只要样本量足够大，任何这些偏误 
都会被看做是“重要的”维度，并且不能被抽样变异性所 解释。 因此，这意味着 

在进行了合适的旋转后，以实质意义为依据来忽略不那么重要的因子也许 

更好。 

尽管我们把这种方法推述为一个保险的步骤——它检验单个共同因子的 
棋型是不是足够，如畢数据“显著地”偏离单因子模型，我们就检验双因子模型 

是否足够，依次类推一但这个步骤用在大量变量上则很费劲。因此，我们可 

以把其中一种决定共同因子数 JI 的快速方法(下面将会介绍)和最大似然法的 
检验结合起来。在一开始“猜测”了显著的因子后，如果数据明显地偏离假设的 
模型，我们可以增加因子的数量，或者如果初始的模型被认为足够而被接受，我 
们可以减少因子的数置 （ 以保证我们获得符合数据的最少数量的因子 )6 从统 
计的角度来讲，最小二乘法没有最大似然法那么有效率，我们对检验显著性的 
方法也持有相同的看法。 


通过特征值进行设定 

最常用的解决因子数量问題的准则是在分解(未调整的)相关矩阵时保留 
特征值大于1的因子。这个简单的准则似乎很有效，它通常会产生与研究者 
的预期相一致的结果，它被应用到人为创造出来的总体棋型的样本中也很 
有效 4 

在总体的相关矩阵中，这个准则总能设定共同因子数量的下限。也就是 
说，用于解释相关矩阵的共同因子的数量总是等于或者大于这个准则所界定的 
数量。然而，当我们考虑样本相关矩阵时，这个不相等的关系不一定能保持。 
尽管 Kaiser 对它的有效性给出了很多解释， 但璋受 这一准则仍然是基于探索性 
和实用上的 考虑。 在研究了其他更“复杂的”准则后, Kaiser 仍然坚持使用这个 
准则 (Kaiser， 1974〉。 

另一个相关的特征值准则是在分解简化后的相关矩阵(把多重相关系数的 






意义地 
■和大于 








这是 Cattell U965) 所推荐的检验。这个方法指示我们去研究特征值的图， 
在特征值(或特征根)开始变平并形成一条几乎是平行斜率的线时停止抽取因 
子， Cattell 称超过该点的平滑斜线为“因子垃圾或碎石”(碎石在此是一个地理 
学术语，指在石块坡的下面所找到的碎 石〉。 图 4.1 给出了它的用法。基于这些 
结果，研究者总结出我们最多只能抽取5个因子。 





(Harris, 1967). 考虑到这种方法的复杂性和内在的不确定性，最后决定依据 
研究者所在领域中的现有学术水平来判断结果的合 理性- 这个准则难以捉換， 
但或幸运或不幸的是，我们所有人都不得不接受这种情况，目的在于使我们的 
研究结果可以和其他科学家沟通。 



第 5 章 I 验证性因子分析简介 


迄今为止我们都专注于探索性因子分析，并且也强调为了运用这种技术， 
我们需要进行很多种假设，其中最重要的是因子因果关系和简洁性的假设。在 
这种分析中我们所做的都是给数据强加某一特定楔型，寻找一个和数据最吻合 
的结果，我们可以合理地质疑，运用这种方法是否或者在多大程度上为因子分 
析性棋型自身提供了实证支持。正如之前所述，无论结果如何，我们都不可能 
通过对协方差结构的观察来证明某种因果结构的存在。然而，我们可以估计因 
子模型在多大程度上被经验性地 证实。 




的信息，这主要是因为一个单个共同因子的模型总是和双变量相关关系相吻 
合。因此，因子分析从不在这种情况下运用，这不是因为因子分析性模型与数 
据不吻合,而是由于模型的经验证实度（以下简称为资讯性)为0,同时也因为 
(尽管更微不足道)没有唯一的结果。考虑图 1.1 展示模型中的前两个变量。给 
定任何相关关系，我们都可以随意选择其中一个因子负载在一 1和1之间 (0 除 
外)，且还能找到另一个因子负栽使得它吻合观察到的相关 关系。 简单来讲，总 
是有和数据吻合的因子分析结果》 

当因子分析被应用在三变量的相关矩阵上时，情况有些许改变。如果我们 
发现一个单个共同因子的模型与数据吻合，这时经验证实度不等于0,因为一些 
随机的相关矩阵不能和一个单个共同因子的模型 吻合。 而且，如果一个三变量 
的相关矩阵和一个单个共同因子的棋型吻合，三个相关系数之间的关系就必须 
满足两个条件:⑴所有相关系数都是正的，或者负的系数的数量必须是偶数》 
(2) 任何一•个系数的大小要等于或大于剩下的两个系数 的积： 

I Zy Ol r,kijk I. [5.1]’ 

导出公式 5. 1 所界定的条件是有意义的。考虑《因子分析导论:它是什么以 
及如何运用》中的图 18( 或者图1的上半 部分〉 ，回忆 

m = bib3 和 h2 = b! 
m == b2bs h3 = bl 
接下来，让我们把两个相关系数相乘： 

n 2 m = bibzbiba =试 =试您。 [5.2] 

第一个等号后面的项是用因子负载来表示其相关关系，第二个等号后面的项经 
过了重新调整，最后的项是给因子负栽代人相应的公因子和相关系数。对公式 
5.2 做些许调整，且因为公因子不能大于1，我们得到公式 5. 1所界定的条件， 
h 2 = mna/m <1. 



它暗示 |r 23 |^ ImnaI. 一般来说，所有三变置的单个共同因子的模型都必须 
满足条件 Ir^l^l r lk x5kl. 由于不是所有随机生成的三变量的相关矩阵都满足 










量)。幸运的是，这个数置等于最大似然法的显著性检验的自由度》(对这个数 
量进行详细研究是有意义的，由此我们可以对因子假设和它暗示的自由度有更 
淸晰的了解，这对理解接下来要讨论的验证性因子分析非常重要。） 

然而，有很多种方法可以用来确定一个特定的因子模型所暗示的限制的数 
董。其中一^方法是用秩理论，它指出，如果把正确的公因子放人相关矩阵（由 
一个有 r 个共同因子的模型产生)，调整后的相关矩阵的秩(或者独立维度的数 
量)将会是 r， 因此又暗示所有的超过 r 列和 r 行的子矩阵的行列式数量为0,由 


此，我们可I 
(Harman* 


「以对给定的因子数量和变童数置确定一/ 

J76)。 另一个 方法是在显著性检验 

31的条件数量和运用显著性检验所笔 


-个相关矩阵5 

If 景下研究自 E 


种方法的更一般的背景下讨论。 


为了举例，假设我们从一个经验性的相关矩阵开始 • 这个矩阵所包含的独 


立信息量为 a/2)n(n-l) 一上三角区的单元格的数量，给定这样的数据， 
因子分析通过允许 nXi •(其中1■是共同因子的数量)的因子负栽变化，使之最佳 


地重现观察到的相关矩阵，由此得到初始的结果。但在初始的因子分析中，我 

们要求这些 nXr 的因子负载满足一个条件，即最后得到的因子是正交的。这暗 


示强加了 l/2r(r-l) 个条件。因此，为得到初始因子结果，我们有以下数量可 


自由变动的参数： 









之差： 


所要求的经验限制的数量 = l/2n(n-l)- [nr-l/2Kr-l)] [5.5] 

= l/2[(n —r) 2 — (n+r>]， 

这和前面展示的自由度一样(当我们用一个协方差矩阵代替一个相关矩阵 
时，矩阵包含的独立信息量是 l/2n(n+l>， 而不是 l/2n(n-l)„ 然而，最后的自 
由度仍然相同，因为要增加额外限制，使得因子分析模型可以在这个协方差矩 
阵上运 用)。 


表 S.1 与II个变置和 《• 个因子相关的自由度》 



注,—鷇化的公式为 D- 午咖 ■ 数据要满足的限制的数量 • 


为了熟悉公式 5. 5所暗示的内容，我们在表 5. 1中给出了多种因子数量和 
变量数量组合的实际值。有几点要指出:第一，一般来说，随着变量数对因子数 
的比率的增加，要满足的经验限制的数量也在增加。第二，如果经验限制的数 
量为负值，因子分析结果就不能对模型提供任何经验证实 4 因此，一般来说只 






的矩阵运用 3 个共同因子的模型，都是没有意 义的。 第三，因子数保持不变，随 
着变量数的增加，所要求的限制会迅速增加。因此，在因子分析中每增加一个 
变量，就可以对因子分析性结果增加很多经验性的内容。第四，如果我们把这 
个数宇作为经验证实度的指数,它暗示真正重要的不是比率，而是变量数和假 
设的共同因子数之间的差。需要注意的是，要满足的限制的数量在以下组合中 
几乎相同:1个因子和7个变量 (14) ; 2个因子和8个变童 (13) »3个因子和9个 
变童(12)，等等。但没有理由认为这个指数是经验证实度的直接 测量。 另一个 
可以考虑的选项是 (a〉 要满足的限制数对 (b) 观察到的矩阵中独立的系数数量 
的比率。尽管我们没有把这些比率显示在表中(基数在最后一 列〉 ，但需要指出 


在评价因子分析结果的经验证实度时，要考虑两个问題。第一个是这些要 
求即使在总体中完全得到满足，也可能在样本中无法完全满足。第二个是即使 
在总体中，因子分析性棋型也未必完全和数据吻合。因此，在评价这个要求时 
要考虑些许不拟合的情况。但最让人沮丧的是在实际分析中没有办法把这两 
个问题分离开来。因此，实际上我们不能只用公式 5. 5作为对经验证实度的测 
置。给定观察到的数据和因子分析结果之间的一定程度的拟合，一个需要满足 
更多经验限制的结果的证实度就更髙。但为了进行评价，我们要寻求一种方法 


的数据之间的差异在多大程度上可以归结为抽样误差，显著性检验直接依赖 
于样本貴，只要样本暈够大，模型和观察到的数据之间的任何差异都会变樽显 
著。其原因在于，如果因子模抵和总体数据完全吻合，样本量越大，总体值和样 
本统计置之间的差别就越4、。如果样本量非常大，那么离差就要非常小。 


当研究者怀疑存在次要的因子，但不愿意或者无法确定它们的结构时，这 




充分的。因此，我们需要一个描述因子模型是否充分的指数，它在概念上要和 


统计显著性不相关。 

我们需要的统计量是 
Harman 建议，一种方賊 
析的最后结果)和预測到白 


，察到的相关矩阵和重制的矩阵之间差别的测量。 
i 差均方——它把观察到的相关关系(根据因子分 
色关系之间离差的平方加总一 


「加总——除以我们要考虑 


的单元格的 数量： 

2 2 ( r »i — Si) 2 /Cn(n—] 

此处的加总是对所有不在对角线上的元素加总 (Ha 1976:176). 然而，这 


的信度系数 



;于因子分析结果的相关兰 

之间的拟合 程度。 然而，他们的倌度系数整合： 

自由度，因此调整了因子分析结果之间的潜在差异，且它比较了调整后的离差 
以及与之可比较的假设因子不存在情况下的离差，因此使它成为削减调整后的 
误差比例的一种测量。因此，这个系数取值在0和1之间，袖 
合，后者意昧着完全拟合。公式的简化 A 

rh0 = M2 ^ ：5.6] 

在此 Mo 等于在没有因子作用下的预期的 X 2 除以 ( l /2) n ( n - k - l ) ①, Mk 等于 
最后结果的 X 2 除以 ( l /2) C ( n - r )2-( n + r )] (SOrbom &■ Jdreskog , 1976:4— 
5). 当样本量增大时趋近于公式 5. 6,对其更为有用、但没那么准确的推述是： 









在探索性因子分析中是 l/2[(n — # _( n + r >]， 但在验证性因子分析中会更大 
些(剩余偏相关系数不过是一个标准化后的预测的相关系数和观察到的相关系 
数之间的差)。 


另一种概念的经验证实：抽样准确性 

传统的统计检验假设抽样的对象是单位(物体或实体)，但现实中我们不能 
忽略它可能涉及一定程度的心理测量抽样——我们所分析的变童几乎总是潜 
在的更大领域的相关变量的一个子集。因而我们要考虑给定的数据(变量的子 
集)是否足以进行因子 分析。 （读者可能还记得映像因子分析和 Alpha 因子分 



度提高。前两个条件与因子模型强加在数据上的经验限制的增加直接相关，第 
三个条件测量的是因子模型在多大程度上解释了观察到的共变关系，最后一个 
条件界定了各变量的方差被共同因子解释的多少。最后一个条件和抽样准确 


系数大小的平均值的增加，总的因子的确定程度也会增加。 

Kaiser (1970, 1974〉捱出了测量抽样准确性的实用指数，他称之为对“抽样 
准确性的”总的测量。 



[5.7] 










0.90 或以上，很高 ； 

0.80 或以上，较高》 

0.70 或以上，中等； 

0.60 或以上，较低； 

0.50 戒以上，很低》 

0.50 以下，无法接受， 

Kaisei •声称分析数据的丰富经验显示, MSA 的大小随以下情况而改进 s 
(1) 变董数的增加;⑵共同因子数的减少^ (3) 个案(实体)数的增加; (4) 平均相 
关系数的增大(1970)。 

概括一下，在多大程度上一个给定的因子分析棋型适合我们研究的问题， 
数据所提供的经验证据是因情况而异的。研究者应该了解什么条件可以改善 
因子分析的资讯性。此外，因子分析的初学者应该依据类似于 Kaiser 的 MSA 
之类的实用指数来粗略地判断自己的数据是否适合运用这种 技术. 当然，理论 
上的正当性是最终决定的基础。 

验证性因子分析 

任何验证性因子分析的最起码的要求是我们要亊先假设共同因子的数量 # 
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然而，如杲非要说这个假设跟直聲或猜测不同，那是因为它依据的是我们对所 
考虑的变量性质的理解，同时也依据哪个因子可能在哪些变量上有负载的预 
期。这点无论怎么强调都不过分，因为这些因子分析假设的实际形式几乎是 
无限的。 

我们可以把验证性因子分析分成两大类： （1) 只涉及一个群体成总体,（2> 
涉及两个或更多的群体或总体。下面我们先介绍第一类 # 

















最大程度的相似性、且能最大程度重新生成观察到的相关关系的矩阵，都是可 
能的。在前一种情况下，对假设是否充分的检査取决于对协方差矩阵之间相似 
性的检验，在后一种情况下，对两个因子结果之间的相似性进行检验以做评估 
是有必要的。读者可以参考本丛书中的一本来了解更详细的信息 （Levine， 
1977)。 一般来说，在实际的因子分析中我们不能预期研究者能有如此明确的 
假设。然而，如果我们正在比较根据一个数据而来的因子分析结构和根据其他 
数据而来的结构，我们就有可能作出这样的假设。这种情况可被归纳到我们下 
-个即将讨论的更一般的方法下。 

因为 SSAom 和 Joreskog 最新的验证性因子分析程序允许较大程度的灵活 
性，因此我们会简单介绍程序中一些重要的设定选项 （Sdrbom & Jdreskog, 
1976). 我们可以用几种方法设定任何参数。在因子分析中涉及的参数包括因 
子负载(共同因子的 nr) 和因子之间的相关系数 （l/2ir< r — 1)), 这些参数中的任 
何一个都可以固定为特定值或者允许它自由变动》通常来说，最有用的固定参 
5. 举例来说，如果固定所有因子相关关系为0,也 
t 定了正交旋转的结果。另一种设定参数的方法是限定某个参数等于 


数的方法是设^ 
就等于设定 TJ 
另一个参数。 


为了使前面的讨论更加具体，我们在表 5. 2中给出了 3个设定自由的和固 
定的参数的例子。在这些倒子中,X代表可自由变化的参数，0代表固定的参 
数——固定为0。我们可以把参数固定为其他值，例如1.0、0.5,等等，但我们 
认为研究者也许只知道在哪里负栽会髙，在哪里负载会低。第一个假设设定一 
个单因子的结构一在给定变量数后可能的最简单的结构，第二个假设预期有 
般性因子和两个群体因子，第三个假设设定一个特殊的层级 关系， 研究 
者当然也可以在这些模式中引人很多修正。 

在进行上面例示内容的同时，我们也要设定因子之间关系的 性质。 这种设 
定最常见的形式是:⑴将所有的因子关系设为0—即正交假设， (2) 允许所有 
相关关系变化一即斜交假设》 (3) 混合形式，即其中一些假定为正交,其他則 
允许取任何值。 












中，模型可以被界定为一个有2个相关因子的验证性因子分析，正如图 5. 1所表 
示的那样。要注意到这样的模型跟表 5. 样本 1) 所界定的结构没什么不同，它 
们都对因子之间的关系没有限制。在这里我们只是提到了验证性因子分析最 
简单的扩展形式;有兴趣的读者可以参考 J6reskog(1970> 以及 Suborn 和 
JO res kog(1976) 更完整的展示。 

比较因子结构 

验证性因子分析的另一种用法是对几个群体比较因子结构。举例来说，我 
们可以假设黑人政治态度的因子结构和白人的是一样的，或者一个社会的认知 
结构和另一个社会是一样的。我们也可以界定因子结构的某些方面在不同群 
体中是一样的，但另一些方面却是不同的。 
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由 Jdreskog 和 Sdrbom 设计的、可以进行模型修改的验证性因子分析程序 
COFAMM, Confirmatory Factor Analysis with Model Modifications， 可以处理 
非常一般性的假设 • 例如它允许对单个群体进行各种因子假设检验——•些 
参数可以是固定的，或者允许自由变化，或者一些参数可以限制为等于另一些 
参数。 此外，通过使用“限制的”参数，一个群体的参数结构的任何一部分都可 
以设定为和另一个群体的该部分相同。 

作为示例，我们再看一下政治态度的例子，我们感兴趣的是比较白人的因 
子结构和黑人的因子结构，特定的假设可以有以下形式:（1>白人和黑人都有 
两个斜交因子; (2) 变量 Xi( 对学校的资金支持), Xz( 降低失业率的 开支〉 和 Xs 
(对大企业的控制)在白人和黑人相同的因子上有相同的负栽;同样，对两个种 
族而言， X<( 校车接送计划)和 Xs 〈工作 配额)都在另一个因子上有负载》 (3) 这 
两个群体在 Xe (启蒙计划)上的预期负载会不同。在这种情况下，我们可以在单 
群体的分析中设定白人的参数，所有黑人的参数都限制为和白人相同，除了一 
个(涉及到 Xs 的)参数。验证性因子分析的详细例子，以及更一般化的“协方差 
结构”分析都可以在 Je r esk 0 g(1967) 的著作中找到。 




I 建立因子尺度 





同〉。 这样的例子展示在图 6.1 的左半部分。在这样的模型中，观察到的变量之 
间的相关关系等于各因子负栽的乘积，因此在本例中它就等于一个因子负栽的 
平方，因为所有的因子负载都相等： 





子和因子尺度之间的相关程度，即尺度的信度 4 


B 子尺度的信度 

尺度 ($> 的方差很容易通过应用第一卷书第2章所用的期望运算导出。得 
到的？的方差用 Xs 的方差表示则为 8 

var(F) = var(Xi) + var(3fe)+ var(X3) [6 2] 

+ 2CCov(Xi, X2> + Cov(Xi, Xs )4- Cov (X2, Xs )], 

该简化是由于在这个例子中权重为1。这个公式可以通过假定各变量的方差为 
1来继续简化，这样协方差不仅和相关系数相等，且互相相等： 

Var(F) = n+2[m + m + «3] [ 6 . 3 ] 


(这样实际上就相当于把 Xs 相关矩阵中的所有元素相加 J 


因为 m = m =如= r = hf (参见公式 6.1)。- 

然而，会中的一些方差由独有因子所贡献，它们的贡献为 Edf = Ea- 
hf), 它可以继续被简化为 n(l —h 2 )。 因为在这个例子中所有公因子都被假定 
为相等，因此，乒的方差中被公因子解释的部分为 


r (F, ?)= 


Var(F)-n(l-h 2 ) 


[6.4] 




它等同于 SpearmanrBrown 的信度公式》它是 Cronbach Alpha 系数的特殊情 
况 (Cronbach， 1951, Lord &- Novick, 1968). (读者应该还记得，在这种情 
况下 h 2 可以被相关系数 rR 替。） 

为了让读者熟悉因子尺度的不确定程度或者说预期“倌度”，我们通过表 6. 1 
给出了公因子和变量数的常见组合的“倌度”值。我们注意到，当公因子的值 
(因子负载或者相关系数)固定，随着变量数的增加，信度就增加。同时也注意 
到，即使有相同的较离的因子负载(例如 0. 8)，但如杲我们只有很少的几个变 
貴，信度也较小。 



差为1。这样的标准化很直接，且可以被纳人到权重里，但它的价值只是修饰。 

表 6. 1不同统一因子负栽值和变量败的预期信度 



因子负载 _ 0.4 0.5 0.6 0.7 0.8 0.9 


公因子(护）或者变量之间的相关系数 0.16 0.25 0.36 0.49 0. 64 0.81 










Cronbach 的 alpha 系数 


如果所有公因子都一致，它就等同于公式 6. 4。一般来说,给定相同数量的平均 
公因子(或者平均相关系数)，负 载统一 情况下的信度比不统一时要高。因此， 
表 6. 1为多种组合的负载很好地展示了信度的上限，这些负载是表中给出的负 
栽的平均值。 

然而，更重要的问題是给定不同的因子负载，我们应不应该在建立因子尺 
度时给予相同的权重。让我们来考虑一个比较极端的例子，其中的一个公因子 
为1，即一个观察到的变量和潜在的因子相连不可分。在这种情况下，我们《 
用该特定变量来描述潜在的因子，忽略其他的变量:增 
量只会歪曲了尺度。 

因此，一般来说，当因子负载不统一时，简单地通过把所有变量加总来建] 
因子尺度是不合适的。如果一个单个共同因子的模型和数据完全吻合，正 
里假定的那样，最优的解决方案相对简单》给予各变量的权重可以由以下得到 


，我们可以 
卜于1的变 

ID 总来建立 
I合，正如这 




[6.6] 


盖繫祝 [6 . 7 ] 

，所建立的尺度的总方差由下列 


var(F) = 2年 wjwjrjj [6. 8] 

它等于把调整后的相关矩阵的所有元素都加总，各元素都乘以相应的权重 Wi 和 




Wi (调整后矩阵在它的主对角线上会包含给定变量的各个权重)。因为这个值 

等于多元 R 2 ，它不会小于最大的公 因子。 因此，如杲一个变量跟潜在的公因子 

完全一样,这个变量会得到所有的权重，而其他的变量会被忽略。 

在建立指标的时候，另一个重点是当我们用不同的权重时，让一个变置有 
较离的负栽通常比让很多变量有中等的负载要重要。同时要记住，尺度的侑度 
至少会跟最高的负载的平方 相等。 


抽样变异性和模型拟合的不同标准 

迄今为止，我们讨论了理想的情况，即单因子模型和数据完全吻合,且没有 
抽样变异性(当然，这暗示着我们假定潜在的模型完全可以被识 别)。 当在数据 
中引人抽样变异性时，我们在样本中观察到的关系就不会跟总体中的真实情况 
完全一致。即使一个单个共同因子的棋型在总体中跟数据完全吻合，这样的棋 
型也不可能完全解释在数据中观察到的样本关系。这个问題要求研究者用一 
个标准来评价尺度和潜在的因子之间的拟合程度 # 在文献中有以下三种标准： 


第一个标准是找一个因子尺度 (f>， 这个尺度 ($) 和潜在的共同因子 (F) 之 
间的相关系数最大。或者换言之，这个标准就是最小化两者之间的离差的平 
方，即最小化 S( f -P) 2 。 为了符合这个标准，我们要运用回归的方法。这种 






接着我们考虑在因子尺度中用预测的会代替 F。 这个标准是构建一个癸使得 
以下的平方和最小。 

最小化 [6.10] 

该标准导出的权重为 

F = X(BB’)_iB [6,11] 

注意到它和公式 6. 9之间唯一重要的不同之处在于，我们用重新生成的相关关 
系 (BB') 代替了观察到的相关关系 (R)„ 因此，在我们处理总体的变量，且它们 
和单因子模型完全吻合时，这两个标准会得到相同的指标。然而，当样本的相 





结果是包含公因子较小的变量被给予更小的权重。因此，在因子负載不统一的 
佾况下，这个标准得到的尺度跟前面两种标准所得到的会不一样。导出因子尺 
度的公式 (6,13) 看起来很复杂，但其背后的原则并不难以 理解： 

F = XU-2 B(B f U-2B)-i [6.13] 

此处 U 2 是独有方差的对角线矩阵„在公式中 U_ 2 可以被视为前面描述过的一 
种加权 方法。 

多个共同因子和更复杂的情况 

让我们假设有超过两个共同因子，把情况设置得更复杂些。前一节中讨论 
过的三个标准可以被一般化到多变量的情况下，也可以被一般化到正交或者斜 
交因子分析法中。此外，我们讨论过的单个因子的情况，在考虑多变童和任何 
特定共间因子时也成立。然而，我们建立的尺度一般来说不可能和相应的潜在 
因子完全相关，这会在多个因子的情境下引出两个附加的问题:（1)如果潜在的 
因子之间是正交的，这些不完美的尺度之间会不会也是正交的》(2> 各个尺度是 
不是只和它试图测量的因子相关，而不与其他变量相关，如果因子尺度和其他 
潜在的因子之间的偏相关在控制了它测量的因子之后为0,那么该因子尺度是 
否就被称做是单一的？一般来说，任何一种建立尺度的方法，这些要求都不能 
同时被满足。即使潜在的因子之间被假定为正交的，因子尺度之间也会互相相 
关;此外，如果我们假定的是斜交模型，因子尺度之间的相关将不能正确地反映 
因子之间潜在的相关。最后，一个因子的尺度会和其他潜在的因子相关。 

但在一种^情况下这些要求都能满足:（1)因子分析性模型和数据完全 
吻合，且没有任何抽样或测童误差； （2) 每个变量仅在一个因子上有负载。如果 
这两个条件都满足，我们可以分别考虑每个因子或维度，这就回到了我们前面 
讨论过的无误差数据下的单个共同因子模型的情况。我们之前提到过，在那种 
情况下，在选择建立尺度的方法上没有任何棋棱两可的地方一我们研究过的 






所有标准都会得到一样的尺度。但遗憾的是，这种理想情况在实际中不可能 
出现。 


然而，在另一种情况下有一些建立尺度的方法可以满足尺度的正交性和单 
一性要求。如果最初未旋转的因子是通过最大似然法(或者正則方法)得到的， 
且如果这些尺度是通过回归或者 Bortlett 方法建立的，那么这些未旋转的因子 
的因子尺度将会是正交的和单一的 9 然而，这只提供了些许安慰,因为我们不 
能期待潜在的因子模型是正交的。此外，在正交旋转后回归方法不能满足任何 
一 个要求，而 Bortlett 的方法只能满足单一性的要求。因此我们讨论过的任何 
-种方法都不可能得到正交的尺度。 

这些结果促使我们考虑 Anderson 和 Rubin (1956) 提出的第四种标准。 
Anderson-Rubin 标准是 Bortlett 标准的修正，它最小化 Bortlett 标准所用的加 
权平方和，其限制是建立的尺度要互相正交。因此，不管因子是否被旋转过，只 
要它们是基于正交旋转的方法，这个标准就能够产生互不相关的因子尺度。然 
而，这些尺度对旋转后的结果来说不是单一的，即使初始的旋转结果是基于最 
大似然法。 

如何选择 

在这些方法中进行选择时，研究者必须考虑这些方法内在的特点，同时也 
要考虑因子分析以外的要求。以下我们对这些方法内在的特性做一些综述。 
就潜在的因子和它相应的尺度之间的相关关系来说，回归法要比 Bortlett 方法 
更好，但 Bortlett 方法又要比最小二乘法好 4 就单一性的要求而言， Bortlett 方 
法最好，但就正交性的要求来说， Anderson-Rubin 的标准更理想。然而,考虑到 
在大多数研究情塊下，研究者不大可能会坚持潜在因子之间的正交性，因此实 
际的选择就在回归法和 Bortlett 方法之间。 

我们也要讨论其他一些因素，这些因素有的把选择变得更复杂，有的把选 
择荷单化。首先，用不同方法得到的尺度之间通常有很高的相关关系，因此，对 
任何研究来说，选择都应该是基于学术考虑的。建立尺度的一种方法和另一种 
方法一样，都要能够满足要求 (Hom， 1965, Alvrin, 1973). 第二,选择也依赖于 



方法在某些特定类型的研究中更合适。更具体地说，他证明了2 
的尺度无法让我们正确地估计假设的因子和外部变量之间的相 
的方法则能让我们做到这一点。另一方面，如果使用因子尺度 
了把它作为外部变®的预测变貴，那么基于回归法得到的尸 


然而，要注意的是，我们迄今为止的讨论都是基于一个假 i 
合，所以模型和数据之间的任何差别都袖 
a 果我们预期的这种完全吻合不出现， 
子分析用做在数据中把变量分成主要大类的探索性方法，此 
f 有细节都成了次要问题，因子分析以外的考虑则更重要 • 


总体中和数据完全吻合，所I 
误差的结果。但是，如果我 i 
子分析朋 
所有细节； 


基于因子的尺度 


基于两种完全不同的原因，我们可能考虑只运用因子分析 •= 


i 果中得到的一些值会受到抽样误差的影响。在此我们可 u 

. 中的特定变化，只把一类信息看做相 关的: 一个变量要么在给另 

栽，要么没有负载。第二，尺度可以通过对有足量负载的变量加 
量负载的其余变量而得到。通过这种方法建立的尺度不再是因 
基于因子的 尺度。 这样建立尺度背后的原因是 :（i) 即使在总本 
因子负载为0,它们在特定的样本中也不为0;⑵即使在总体中 | 
匕。这种情录下的常规做法是把 

?合理，取决于它背后特定的假设? 


I想状况下，我们可以用验证性因子分析3 
单的负载棋式”被验证性分析所支持，那4 


度，而是一个合理的因子尺度。伹是,实际上 i 


眼么它就不 
:即使我们 i 



















成分得分 


最后，我们想评论一下由主成分分析法产生的尺度 * 正如之前提到(强调） 
的，主成分分析法背后的原则与因子分析不同。因此，它们不能相互代替。但 
在实际研究的更大背景中，它们都有合理的应用。在一些情况下成分得分可能 
比因子尺度更合适。尤其是如果目的只是对尿始数据中包含的信息进行简单 
的总结，而不需要因子分析性的假定,那么使用成分得分绝对要比因子尺度好. 
这也是为什么对成分尺度进行评论很重要的原因，即使只是简单的评论。 

正如前面提到的,主成分法不过是对原始变量进行准确的数学转换，因 
此，用原始变量的组合来确切地表示成分是可能的，我们可以称其为成分得分， 
而不是尺度或估计。这个得分从各种原始变量的组合中得到，这些尿始变量的 
权重跟他们的成分(因子)负载成比例。 

成分得分= [(bij/XiJXj] [6.14] 
在此 bg 是第 j 个变量在第 i 个成分上的负载， Xi 是相应的特 征值。 公式中除以特 
征值只有修饰作用，因为它只是保证最后得到的指标的方差为1, 



对常见问题的简单回答 










Kim, 1975)。 因此,只要我们认为对定序类别给予数值所造成的扭曲不是很 
严重，那么把定序变量作为度量变量仍是合理的。然而，我们应该注意到在 
因子分析性结果中由于非随机测量误差导致的可能的扭曲，即使这些扭曲是 
轻微的。 

4. 二分变量如何？有*人认为把因子分析应用刻二分变量上没有问題，原 
B 有二:（1)因为给二分类别赋值并不真的要求有測量假设》(2)因为前述观点，於 
和皮尔逊相关系数等同，而它是因子分析中对相关关系的合适測量。因此，把 
因子分析应用到#的矩阵中难道不合适吗？ 

不合适。首先，我们不能在因子分析性模型中表达二分变量。更具体地 
说，回顯 Kim/MueUer, University Paper 07-013 的第2节,在因子分析中，毎 
个变量都被假定为是至少两个潜在因子(一个共同因子和一个独有因子)的加 
权和。即使这些潜在的因子也有两个值，正如在 University Paper 07—013中的 
表1所展示的那样(在真正的因子模型中这种情况很少出现)，观察到的变量的 
值至少包含了 4个不同值，这明显不符合二分变量的情况 s 因此,无论如何在二 
分数据中运用因子分析法都是不合适的，除非只是为了探索。以下3个问题也 
是相关的。 


5. 前述筠答暗含的意思让人担忧*因为我们一般把潜在的因子看做是可 
能连续的，所以我们顇期的吏量包含许多 类别。 然而，我们处理的大多数变量 

通常只有有限的类别——是或否，同意或不同意，或者最多有强烈同意，同意， 



从某种意义上说，是的 • 严格来说，只有少量类别的变量是不符合因子分 
析性棋型的。如果我们把观察到的变量看做代表了粗略的测量或对相邻值的 
分组，问題就不再是数据是否内在的符合因子分析模型，而是非随机测量误差 


是否以及在多大程度上扭曲了因子分析的 结果。 对数值进行分组当然彩响了 
相关系数，但其程度取决于分组的粗糙程度、分布 的疮状 ，等等，然而，即使在 
严重的测量扭曲情况下，把因子分析作为探索性的工具也有一些令人鼓舞的看 
法(参见下一个问题)。 









情况下，我们可以把因子分析运用瑚包含二分变量或只有少量类 


泛来说，类别的数量越多，扭曲的程度 越小。 即使对二分变量，如果因子 
目做寻找一般变量丛的工具，且如果变量之间潜在的相关系数被认为是 
— ^如小于0, 6或 0. 7,用 phi 也是合理的。原因是连续变纛的二分化 
自关关系，这个弱化也受到切点的 影晌。 然而，当潜在的相关关系不是 
切点的变化对相关系数的影响可以忽略*因此，分组一般弱化了相关 
不会影响数据中集群的结构——因为因子分析只依赖于相关关系的相 
如果研究者的目的是寻找集群模式，使用因子分析则是合理的 (Kim- 
Verba, 1977)* 

如果因为切点导致的扭曲比由于分组导致的(相关关系的）典化更严重- 
为什么不用如 H 或者 R/Rm^ 代替♦或者 r 进行调整？ 

这个修正只有在潜在的分布形状有特定的形式时(可能性很低 KCarrol, 
1961)，或者当潜在的连续变量之间完全相关时，才是合适的。如果是完全相 

子分析就没有意义。因此，使用这样的修正是自相矛盾的 (Kim 


文献中提出了两种 方法。 这两种方法都假设二分或多分变量是通过分组 
■J 檻作用而得到，且这些变釐是潜在的连续变置的指标变量，因子分析实 
匕是运用到这些潜在的连续变量上 * 因此，为了解决因子结构的问趣，我 
?找出潜在的变量之间的相关关系。其中一种做法是用四分相关系数代替 
t 只是探索性的，因为四分相关经常出问翅，且其相关矩阵不一 
的 (Bock&Liebennan，1970). 另一个方法是直接处理潘在的 
，而不是基于双变量的表格来计算四分相关系数，这是个有潜 
但即使使用现代计算机，其计算量也很大 （Christoffwsson - 







这取决于〆 1) 变量是否有可相比的矩阵； （2) 使用的是哪种抽取因子的 
方法〆 3) 我们是否要比较因子结构。如果我们只考虑一个群体（或样本）， 
并且使用的是无尺度的抽取方法，例如最大似然法、 Alpha 因子分析法或者 

映像分析，且我们的目的是确定潜在的维度，那么使用哪种矩阵都没有多大 

区别。然而，如果我们用协方差矩阵，且尺度变化很大,尺度因子会把对结果 

的解释复杂化。因此，如果变量之间的方差有差别，且尺度变化很大,例如一 

个变量的单位是美元，另一个变量的单位是年龄或受教育年限，第三个变量 
是一个5分的 Likert 特量表。此外，出于实际搡作的考虑，我们推荐相关矩 

阵。 一些计算机程序不接受协方差矩阵，而且文献中的许多例子都是基于相 

关矩阵。 

2. 什么时候用协方差矩阵更好？ 

如果考虑要比较不同群体的因子结构,用协方差矩阵更好。原因是相关矩 
阵是通过按照样本特有的标准一例如样本均值和方差一来调整变量而得 
到。由于这个原因， BP 使理论上认为因子分析涉及不变的因素，我们也不能预 
期它们在群体(样本)之间不变，因为在计算相关系数时，测量尺度在不同群体 
间被重新标准化了 (Kim & Mueller, 1979,对一般性因果分析中标准化变量的 
后果的解释和付论》也可参考 Sdrbora &■ JSreskog， 1976 , 90). 

3. 如果目的是在不岡群体间比较因子结构，而变量的測量尺度差别较大， 
我们应该怎么做？ 

一种方法是用一般的标准，例如把合并后的群体作为参照群体的均值或者 
方差，来标准化变量。这样就可以计算各群体的方 差一协 方差矩阵 4 这跟使用 
群体各自的相关矩阵不同，因为那么做意味着用群体(或样本)各自的标准来转 


化各个群体的变量。 









与显著性检验和因子分析结果稳定性相关的问題 


体量至少比 
5 50,在这里 


1. 如果运用最大似然法和相关的显著性检验，要求的最小样本量是多大？ 
样本童越大,X 2 的估计 越好。 Uwley 和 MaxweU(1971) 建议样本量3 

考虑的变置数多51,这时检驗才是合适的，也就是说， N-n-l>50,« 

N 是样本量 ,n 是变量数。当然，这只是一般性的经验原则。 

2. 各假设性的因子应该有多少个对应的变量？ 

Thurstone 建议每个因子至少有3个变量，但如果运用验证性因子分析就 
没必要满足这个 要求。 一般来说，研究者大多同意变量数至少为因子数的 
两倍。 

3. 交量的多元正态分布傻定总是必要的吗？ 

因子分析性模型本身并不要求这样的 假定。 例如，即使用二分因子，我们 
也可能建立一个因子分析性模型。然而，最大似然法和相关的显著性检验要求 
这个假定。但一般来说，我们对违反这个假定的后果并没有清晰的理解。 


其他各种统计问题 


1. s 子负栽的正负号含义是什么？ 

正负号本身没有内在的含义，它也不应该用来估计变量和因子之间的关系 
大小。 但是，相对于其他变量的正负号而言，对给定因子的变量的正负号有其 
特有含义，不同的符号意昧着变量和因子之间的关系是相反的。因此，最好在 
因子分析前把变量编码成相同的方向。 

2. 与旋转后的因子相关的特征值的含义是什么？ 一个给定的旋转后的因 
子所解释的方差比例意味着什么？ 

与未旋转的因子相关的特征值跟旋转后的因子的特征值的意义不同，除 

了特征值的和相同。在最初的因子分析结果里，特征值的降低程度吿诉我 

们各因子的相对重要性。旋转后的结果则不同。一旦我们通过旋转分离了 
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. 研寒社会行为有两寻 
J 计一个 模型幸兮析官 f 


文集观 察抽样调查的或其他形式的数据,并通过 
卜析宅们;或者是从 il 竿 i 种社令.行为的理论认'_开摊，建立一个关于 
它的模型，然后棋拟它的动态过程以获得一个对看似简单的社会系统的复杂性的更好理 
解。 Sage “社会科学中的定量应用”丛书中的大部分采用的都是第一种方法纟基于 
希动者的模型,作为极 b 的例外之$，采用的是第二种方法。 

应用于社会科学坤许多统计方_袖有一个漫长的发展历史。比如，回归方辩于 
高尔顿 (dabn) 在 19 世'皆的知锁#工作。基于荇动者模型的起源通常归功子為诺依 
曼 (Von : Neumam), 因为'他在20.世纪40年代晚期发明了以他的名字命名的机器。虽然 
名为冯 • 诺依曼的机器并不是基于行动者模型甚至也不舉任何种类的模型，但是它们作 
为理论建构为虚拟生活的建构和模型化奠定了基础。在过去的十几年里,基于行动者模 
型在经济学、政治学、社会学和其他一些4王会科学中已经变得越来越流行。 

这一分析方法有-何独特之处呢？比如，以 Thomas Scheiling 发表在,1971年 《数 学社 
会学期刊 >( Journa / of Mathematical Soc / otogy ) 的经典之作为例。他建立了一个非常简单 
的区隔动态模型，这个模型是通过在棋盘上依照一定的简单规则去移动_分和一角的硬 
币来实现的I 一 _ 二 角的硬击 代袅 了居住在棋盘(城市)方格(房屋或地段）中两个来 
自不同社会群体的行动者。令人惊奇的发现在于 ，虽 然每个行动者都容忍来自不同群体 
的邻居(或者适度地偏好自己所属的群体)，，但总体(在整^棋盘一城市中)暈终依然 以出‘ 
现严重的区隔结束。 Schelhng 这个简孕^基于行 动‘模犁毐示 备了微观层庚%个体动 


湖/ Sooetiesand Sxial Stou / atoi ) 的编辑，是为这个系列的此^^写- 


、合琿人举^在本书中, Gilbert 以通篇的 例子来 解释基于行动 
基于荇动 - 模型的应用软件。他穹晰、明? 1', 迻务 
者掌握是非常重要的,这些研究者都能熟练地运用回归类I 


;书的'最 

■mi 


I对 于使一 个不熟悉的议题能够被研究 
lo ! 这本书及时地 填补了 
这个系列的重要空白,这个琴_拜我作为 f fj 孕书的编辑希望填补的，它埤有助于#播一 
种在本质上非常有用的方法，&这种方法是&■们作为社会科学家都应该知 i-o 






基于行动者的模型是一种计算机模拟的形式。虽然模拟作为一种研究技 
术在从天文学到生物化学的自然科学中已经是非常重要的部分，但直到最近为 
止它在社会科学中仍然是被忽视的。这可能是因为缺少尊重社会科学特殊需 
求的计算机方法。然而，在20世纪90年代早期，基于行动者的模型的价值开始 
逐渐被认识，从那以后,运用基于行动者的棋型的研究数量开始迅速增长，一些 
例子也开始在核心期刊上出现 (Gilbert & Abbott, 2005). 

当理解一些议题的过程和它们的结果同样重要的时候，基于行动者模型就 
特别适合于这些议题。在本质上，人们创建一个计算机程序，然后运行这个程 
序，观察它在整个模拟期间在进行 什么。 在被模型化的行动者和程序中的行动 
者之间存在一个直接的对应，这使得这种方法在直观上颇具吸引力，尤其是对 
那些玩电脑游戏长大的一代。尽管如此，基于行动者的模型从严谨性上来说仍 
然位于数学和统计模型一边。如同基于公式的模型，而不是像散文那样。基于 
行动者模型如果能够被电脑执行的话，它们就必须具有完整性、一致性和淸晰 
性*另一方面，基于行动者的模型和大多数数学模型不同，它能够包含在特征 
和能力上有异质性的行动者，能够对远离均衡的情况建棋，并能够直接处理行 
动者之间互动的结果。 

因为是一种新的方法，所以现在只有很少的课程讲授基于行动者的模型的建 
模技术，虽然课程数量正在迅速增加,但是只有很少的课本是直接针对有兴趣的 
社会科学®^者的 （Degushi, 2004, Gilbert & Terna, 2000, GUbert &. Troi- 
tzsch，2005* Grimm & Railsback, 2005? Liebrand, Nowak &. Hegselman, 
1998» Macy & Wilier, 2002 f Schweitzer, 2003> Tesfatsion &• Judd, 2006). 




这本书提供了对此模型的介绍，强调了当选择基于行动者模型作为合适的方法 
时建模者需要作出的决定，并给出了关于如何进行相关操作的一些技巧•本书 
的目的是使社会科学家和研究生们能够进行操作实践，而且它已经在计算机社 
会科学研究生层次的模块或博士生项目中被用做基于行动者建模的推荐 读物。 

它也适合于作为关于离级社会研究方法的研究生课程中的辅助性读物。在任 

何语言下的计算机编程知识和经验都将有助于理解本书，但并不是必要的。 

这本书最后以出版的书箱、网络资源和参考文献作为 结朿。 因为这个领域 
发展得异常迅猛，所以只能提及现有研究中的一些例子和在特定议題上提供有 
着更多细节的参考书。如果容量足够的话，其实还可以引用更多的内容。另 
外，本书只简要地提及了两个与基于行动者的棋型紧密相关的领域:网络棋型 

和博弈模型，关于二者更加详细的内容都在 Sage 丛书的其他卷中有涉及，比如 

Scott 的社会网络分析 (Social Network AnaZy«s〉（2000) 以及 Fink, Gates 和 
Humes 的博弈理论问题 Theory T^cs) (1998). 








^! 基于行动者建模的构想 

















首先，基于行动者的模型是计算机社会科学的一种。也就是说，它涉及建 
立作为计算机程序的棋型。建模的思想在大多数社会科学中都为人所熟 知:创 

建某种“社会现实”的简化代表，以尽可能淸晰地展现出人们所相信的现实世界 

的运行方式 4 例如，如果有一个因变量和一个或更多的自变量，回归方程就可 

以作为变量之间关系的模型《由节点和边线组成的网络可以模型化一组朋友 
关系。甚至对一种关系的普通语言描述,比如一个国家中保护知识产权的力度 

与创新程度之间的关系,也可以被看做是一个模型，虽然这是一个简单和相当 

非正式化的 模型* 

计算机模型作为计算机程序被公式化，其中存在一些输入（如自变貴)和 
—些输出（如因变量） • 程序本身代表了被认为存在于社会世界中的一些过 
程 (Macy &Will er ，2002). 例如，我们可能有一种关于朋友影响消费者购物 
选择的理论 • 我们将会看到，我们能建立一个程序，在此程序中，个人(行动 
者>根据他们自己的偏好来购物。而有趣的地方在于,一个行动者所购买的 
物品将影响其朋友的购物行为，并且这个朋友所购买的物品又会反过来影响 
到第一个行动者。运用基于行动者建模就相对比较容易模型化这种相互强化 














在物理学、化学以及部分生物学中，试验是进行科学研究的标准方法，但在 
社会科学中，进行试验是不可能或不合适的„ —个试验包括将一些处理应用于 
一个封闭的系统并观察发生的反应，将被处理过的系统与另一个在其他方面都 
相同但未受到处理(被控制）的系统做比较。试验的最大优点在于使人们能够 
确认正是这个处理引发了被观察到的效应，因为在被处理系统和被控制系统之 
间不同的只有这个处理，并且这徨系统是与其他可能引发变化的因素隔离开来 
的。然而，在社会系统中，隔离通常是不可能的。因此，虽然试验的结果具有潜 
在的淸晰性，伹却很少被社会科学家所采用就不奇怪了。 

基于行动者建模的一个最大优点是:在确保人类系统的隔离和避免试验的 
道德困境时可能会遇到的困难在对虚拟或计算机系统进行试验时都将不存在。 
试验可以通过使用一系列参数或允许一些因索随机变化的方法而被配置和重 
复很多次。当然，用关于一些社会现象的计算机摸型来进行试验时，只有当这 
个棋型以与人类系统一样的方式运作，或换句话说，只有当这个 模逝是 一个好 
模型的时候，才会产生有趣的结果，但人们可能并不知道情况是否 如此。 所以， 
基于模型的试验并非是万能的。 

在模型中而不是在真实系统中进行试验的想法其实并不新颖，例如，建 
筑师将一个摩天大楼的模型放在风洞中去测试它在狂风下的运动，他们对模 
型进行试验的原因与社会科学家想要对他们的模型进行试验的原因是一样 
的:对真实摩天大楼进行试验的成本太高了。另一个对模型进行试验的理由 
在于这可能是得到结果的唯一方法。分析性地得出模型的运动通常是最好的 
方法，因为它在一系列给定的输人值下给出了关于模型将如何运动的信息， 
但通常分析性的解决方案并不容易获得。在这些情况下，就有必要对不同的 
输入值进行试验来看棋型是如何运动的。棋型可能处于许多不同的环境之 







下，以此来模拟真实世界。 

模型 

计算机社会科学是基于建构模型然后用它们来理解社会世界这样的思想 
之上的 (Sawyer， 2004〉。棋型在社会科学中已有很长的历史——比计算机使用 
的历史还要长很多 一 但只有在统计方法开始应用于分析经济学和人口学中 
的大量定量数据时它才崭 II 头角。模型试图去代表或模拟一些真实存在的现 
象，这被称为模型原型。模型的两个主要优点在于它简明地展现了原型特征之 
间的关系，并且它使人们可以通过研究模型发现关于原型的信息 （Carley， 
1999). 

一个众所周知的最早的社会科学模型是 Philli pS (1950〉 的经济学水力模逛， 
在这个模型中，相互联系的管道中流动的水被用来代表货币的流通。这个棋型 
目前仍然能够在伦敦的科学博物馆中被欣赏到 （http://ea Wikipedia, org/wi- 
ki/MONIAC_Computer)» 改变参数诸如利息率的影响可以通过改变流经管道 
的水的流动率来研究。 

模型有许多风格，有必要列出其中的一些来说明它们之间的差异： 

(1) 比例模型是原型较小的版本。与大小一 起咸小 的是在模型细节和复 
杂性水平上的系统性 减小。 例如，一架飞机的比例棋型可能与它的原型具有 
相同的形状，但可能没有展现电子控制系统或可能没有真飞机上的引擎。同 
样，一个城市的比例模型将比真实的城市小很多而且可能只模型化了两个维 
度(例如，建筑物之间的距离，却没有建筑物的 高度八 当在研究完棋型后再 
对原型下结论时，我们需要记住，从模型中得出的结论需要按比例还原到原 
型的维度上去，并且有些没有被模型化的特征很可能会影响到结论的有效性》 

(2) 理想型模型是原型中的一些特点被夸大以便于简化的模型，例如 ，一 
个股票市场的理想化模型可能假设信息能够及时地从一个交羼者流向另一个 
交易者》交通的理想化模型可能假设司机从来不迷路等等。理想化具有将一个 
或更多复杂因素移除出模型的效应，如果这对模型如何运行的影响微乎其微， 
那么这个模型得出的关于原型的结论仍将是有用的。 
























模型中，环塊棋拟出一个城市的一些物理特征 * 在国际关系的棋型中，环塊绘 
制出国家和民族 (Cederman，1997) 的 版图。 那些环境在其中代表地理空间的 
模型被称做空间 直观。 在其他模型中，环境可以是一个空间，但并不表示地理 
环境而是其他一些特征，例如，科学家可以被棋型化进“知识空间” (Gilbert， 
Pyka&- Ahrweiler, 2001). 在这些空间模型中，行动者用坐标来表明他们的位 









增抽象 的模型，但它在解释美国和其他城市中心的种族隔离持续性的新 
:中已经很有影响力。这个模型基于一个常规的由单元格组成的正方形 
•城市区域，在此区域内的 t 
1( 让我们称他们为“红，，和 


一个非1 
近研究 r 

网格，正方形网格代表一个城市区域，在此区域内的行动者代表家庭户，他们是 
随机安置的。行动者有两种(让我们称他们为 “红” 和“绿”)。每个单元格一次只 
能容纳一户家庭行动者，并且有许多单元格是 空的。 在每一个时间步骤中，就每 
户家庭对他直接的邻居(围绕着他的8个单元格)进行调査并算出与他不同颜色家 
總个 分数比一些恒定的“容忍”阏值大，即比围绕在一个绿格周围 


的已设定的红格比例或在一个红格周围的已设定的绿格比例大，这个家庭就会认 
为自己“不幸福”并决定搬迁。他就会迁移到网格中一些空白的单元格里。 

在下一个时间步骤中，这个新安置的家庭可能会打破他邻居的“容忍”平 
衡，使他们中的一些变得“不幸福”，这就可能导致一连串的重新安置。当容忍 

阈值在 0. 3或以上时，最初随机分布的家庭户就分隔成红色和绿色的小块，每种 

相同颜色的家庭聚集到一起(图 1. 1)»即使当家庭可以“容忍”居住在临近的大 



«,Wilen*ky, U. I 


夺心，西北大学, IL, 


.edu/netlogo/modds/ 






部分邻居都是不同颜色时，这种聚集也会发生 》Schelling 解释说，这表明了即 
使种族偏见的程度很低，也有可能产生像20世纪70年代美国城市那样的典型 
的强隔离模式。 

Schelling 模型之所以具有影响力是因为以下几个原因 (Allen， 1997)。首先， 
其结果——相同颜色的家庭聚集——令人惊讶，并且这一结果如果只从个体行 
动者的运动规律考虑的话是不容易预料到的。 



这个模型直接给出了如何用经验数据检验它的建议 (Benenson，Omer & Hat- 
na, 2002? Bruch &• Mare, 2006, Clark, 1991, Panes & Vriend, 2004, Zhang， 
2004)， 虽然实践证明非常难取得关于家庭地点偏好的可靠和广泛的数据来计 
算“不幸福”比率。 Schelling 模型与前面提到的其他基于与迁移流动和居住物 
业相对价值有关的公式的模型相比，其优点在于需要估计的参数数目更少并且 
模型易于模拟和分析。现在工作就集中于将此模型变得更加具体，将抽象的正 
方形网格替换为真实的城市地理，并增加更多的因素，例如家庭对想要迁人地 
点的支付能力。 


例如:解释在一个群体中极端主义民意的扩散。虽然有许多相关的研究探讨了 
不同假设的结果和民意传播的机制，但我们在此只回顾一个这样的研究 (Def- 
fuant, 2006> Deffuant, Amblard & Wasbuch, 20021 Hegselmann & Krause, 
20025 Lorenz, 2006? McKeown Shediy, 2006> Stauffer, Sousa &- Schulze. 
2004)。Deffuant 等 (2002) 问到： 










了另一个行动者，那么这个行动者(行动者 j) 的观点受另一个行动者(行动者 i) 
观点影响的大小就是他们之间观点差异的一定比例数，乘以观点重叠数除以行 
动者 f 的不确定性程度，再 W 1。这个公式的效应是，具有非常不确定性的行动 
者对其他行动者产生的影响要比那些具有确定性的行动者对其他行动者产生 
的影响小 (DeKuant， e t al ，2002,公式 1 到6) 9 

除了一些拥有最积极和最消极观点的极端派，每一个行动者在刚开始时都 


些条件下，极堆主义扩散开来，并且最终模拟达到了一个稳定状态，所有行动者 
都成为了在民意连续体的一端或另一端的极端分子。在不存在具有政治确定 
性的极端分子的情况下重新进行模拟，取而代之的是群体融合，所有行动者共 













端分子能够对大多数人的观点产生戏剧性的影响。这一研究对于理解恐怖主 
义运动的发展有一定的启示，在这些运动中一些极端分子能够从更广泛群体的 



易之后市场都要被淸空。社会网络是通过随机连接一对行动者建立起来的，用 
一个参数来调整连接的数量，从堯全连接到完全 分开。 

作者发现，如果没有社会网络，消费者信心就会降到市场无法再维持的临 


















积极臬体经验(不是反复无常的）的积累就有助于维持市场的稳定 6 这表明了 
社会信息如何能使群体经验积累到一个更准确的水平从而降低单个个体不良 







时间。这就是 Strader， : 


E 在分散的装配供给链中被共搴的信息 
5装配供给链在电子和电脑产业中较为 i 
专应商提供材料和次级组件(如电子仪; 


E 中被共享的信息的影响而建立起来的一个模塑。分散 
〖典型，在这一链条中有一小部分数量的 
:器)用来组装非商标产品（如硬盘驱动 















对稀缺自然资源如灌溉用水的管理，这种对基于行动者的模型的神竒运用是 
因为它们符合“参与式”(或参与性)研究方法。除了应用于研究，多行动者模型 
还被用于对协商和决策制定的支持以及对培训的支持，例如对塞内加尔的农民 
(D’Aquino, LePage, Bousquet &- Bath, 2003)， 法国中央髙原护林人和农民 
(Etienne, 2003, Etienne, LePage & Cohen, 2003) 以及南太平洋基里巴斯国 
(Kiribati) 环状 珊班礁 上居民 (Dray etc. al, 2006) 的培训。 

这种也被称为伴随建模的方法 (Barreteau, 2003, Barreteau, Bousquet &- 
Attonaty, 2001} Barreteau, Le Page &■ ^Aquino, 2003) 涉及建立一个多行动 
者系统，这个系统与从在场的人中选出的被调査者有密切联系。作为一个开 
端,被调査者可能会被问及他们对情况的理解，然后他们会参加一个角色扮演 
游戏。最终，当获得充足的知识之后，一个计算机模型就被建立起来并与参与 
者一起用做培训援助或协商支持，回答关于“如果怎样……将会怎样”这种关于 
可能决定的 问蹯。 

例如，为了理解为什么塞内加尔河谷的灌溉计划产生了令人失望的结果， 
Barrreteau 等人 (2001) 推述了参与式模型的使用。他们开发了 一个角色扮演游 
戏 (RPG) 和一个被称为 SHAD0C 多行动者的系统，用以代表卷入将水资源分 
配到灌溉区域可耕种地区的决策制定过程中不同利益柜关者之间的互动。在 
这个例子中,多行动者模型首先被提出来，然后它的主要元素转变为一个 RPG 
(其中表演者等于多行动者模型中的行动者），这一做法的部分原因是为了使 • 
基于行动者棋型有效，部分原因*为了 RPG 更容易应用于农村环塊中 4 作者 

总结这一方法的价值在于“加强了游戏参与者之间的讨论”，以及使“在田野 

中遇到的问题和每个个体分别知道的问娌都转变为常识' 

基于行动者的模型的特征 

这些被选择出来的例子，在表明基于行动者的棋型目前的应用范围的同 
时，也为说明基于行动者的模型的一些特征提供了例证 (Fagiolo, Windrum & 
Moneta, 2006). 









1C 实世界中的行动者存在一个直接的对应，这使 
基于公式的模型更加容易。例如，一个商业 
商和任何其他的重要行动者。在每种情况 
:表整个阶级(如雇员），或者可能是每个雇员分 
员之间差异的重要性。上面推述的电力市场模 
都有一个行动者与之对应。 


织科学中的理论都作出简化偎设，即认为所有行动 
g 或相似的。比如，它们处理的是“典型的公司”或在 
行动者可能在偏好上有差异，伹是遵循不同行动准则的 
使当这种情况被允许时，这种具有各自行为方式的行动 
因此，有充足的理由认为，除非行动者是同质的,否则分 
计箅机模型避免了这一局限:每个 
J 偏好或者依据他自己的行动准则来行事。在供给链 


I子，在这个例子中每个商家都能够拥有它自己控制库 


!中，代表行动者直接 p 动于其中的“环境”是可能的。 
【口行动者必须克服的物理障碍和地理障碍），周围位置 
&诸如人群和资源损耗等因素的影响。例如, Gimblett 
:了在加利福尼亚内华达山脉中背包客的运动来检査 


1管理政策的效果。被模拟为在这片区域中进行徒 

【域地形的地理信息系统连接在一起。环塊在前面 








好的例子。 


许多模型都隐含地假设它们模型化的个体都是理性的，即他们都是根据一 
套合理的准则去行动以最大化他们的效用或福利。（另一种替代的方法是将行 



行动。两者在一些模型中都有一席之地 J 一些经济学家，特别是那些使用理性 
选择理论的经济学家，被人们指责假设的个体“过度理性”，即人们为了选择最 


优的行动过程而经历复杂推理的长链，甚或人们能够遵循无限扩展的逻辑链。 
Herbert Simon(1957> 与其他人都批评这是不现实的，并提出人们应该被棋型化 
为具有有限理性，即他们在认知能力上是受限制的，因此他们最大化其效用的 
程度也是有限的 (Kahneman， 2003)。基于行动者的模型使创建有限理性的行 
动者变得比较 容易。 然而实际上，挑战通常并不是限制行动者的理性，而是将 
他们的智力扩展到一定的水平，在这个水平上行动者能移作出老练复杂的决 
定，就如同人们普遍会作出的决定一样。[ 1] 股票市场棋型和在第1章第2节中 
介绍的隔离模型都是行动者被设计为只拥有严格限制性理性的例子。 

学习 

基于行动者的模型能够在个人和群体层次上模拟学习。例如，上面推述的 
创新网络棋型中的公司能够学习如何生产更畅销和更有利可图的产品，并且随 





体)也在学习瞧产品可以形成 - 
的产品就能为另一个公司提供_买 


f5 导致群体平均 
:育，从而引起在个体！ 

山 2006). 上面 
■J 新型公司学习： 

兴公蜀取代，所以这个部门作 


或被其他行动者教育，从 
验得到分享 (Gilberts 
型的范例:作为个体的创新型公专 
公司倒闭并被更好的新兴公司取代，所以这个 i 
以改善它的表现。 

某些用于设计包含学习模型的技术将在下文中进 





样本中的每一个人以发现在调査结束后的第 1 年年末可能发生的改变是什么。 
然后同样的规律也能重新应用于第2年之后样本出现的状态，诸如此类。当这 
个老化过程开始进行时，样本整体的合计统计值可以被计算出来(例如收人分 
布的均值和方差，这可以与调査当时的分布相比较)，并能作出关于样本所在的 
总体中期望变化的推论 （Gupta & Kapur, 2000, Harding, 1996, Mitton, 
Sutherland &• Weeks, 2000, Orcutt, Merz & Quinke, 1986, Redmond, Suth¬ 
erland &- Wilson, 1998)。 

微观棋拟已经被用来评估在社会安全、个人税收和养老金变化上的分布含 
义。例如，它有助于估计收人门植降到国家补助可以支付的水平之下这一变化 
的影响 (Brown & Harding, 2002〉。试验原型在有数据的情况下也巳经被发展 
出来，它们不仅描述个人也描述公司，并且其中的老化过程不仅受个人特征的 



转变矩阵以明确说明目前在某种状态的行动者在下一年将转变到其他某种状 
态的可能性。例如，需要知道目前在职的人在一年后变成失业状态的可能性》 
另外，因为这一转变的可能性在男人和女人之间、在有孩子的女性和没有孩子 
的女性之间、在年轻人和老年人之间等等几乎肯定会不同，所以需要的不是一 
个单一概率值而是一个条件概率矩阵，这个条件概率矩阵将对应个人状况的每 












系统动态 


在用系统动态方法去模型化时，人们创建了一个模型来表达变量间暂时的 
原因一结果关系，但行动者并不被直接呈现 出来。 最早和最知名的例子是 For¬ 
rester 的世界模型，这个模型被用来预测未来的人口水平、增加的污染和对自然 
资源的消费率 (Forrester, 1971)。系统动态学♦正如其名称所体现的，能够模型 
化交互的变量系统以及能够直接处理因果联系，诸如人口的增加导致资源消耗 
的增长和反馈回路，就像人口增长依赖粮食供给但粮食供给又依赖人口水平一 
样 (Sterman, 2000) • 


通常用图表来虽现系统动力模型比较方便，其中箭头表示变量间的因果联 
系 9 图 1.2 给出了一个虽然简单、但非常典型的生态系统模型，其中，羊的繁殖 















第 2 章 I 行动者、环境和时间尺度 






来的，如 Java，C++ ，甚或 Visual Basic。 这本书不能教授你面向对象的编裎 
(有许多不错的介绍，包括 Eckel， 2005, Niemeyer Kundsen, 2005)，但是由 
于面向对象的编程构想对于基于行动者的模型而言非常重要，因此这里对它的 
主要特征做一 t 简短的 介绍。 

面向对象的编程将程序发展为对象的集合，每个对象都有它自己能做的一 
套事情.对象能够在它自己的属性里面存储数据，能够传送消息给其他行动 
者，并且有决定如何处理数据的方法。对象导向的一般编程方法的优点在于它 
提供了一个高水平的模块性:例如，有关对象的方法是如何运作的细节能够在 
不干扰其他程序的情况下被改变。对于基于行动者的模型而言，另一个优点在 
于行动者和对象概念之间有亲和力:很自然地将每个行动者编程为一个对象。 

在面向对象的编程中存在一些基本的概念： 

(1) 类别是对象的一个抽象说明，包括对象的厲性和它的 方法。 例如，程序 
中可能包含了一个被称为“公司”的类别，用以代表在一个经济体棋型中的一家 
公司。这个公司可能具有诸如资本化，员工数量和销售产品种类等属性，它也 
可能具有一些方法用以描述卖出公司产品给消费者和从供应商处购买公司原 




材料的过程，供应商可能是模型中的其他 公司。 类别可能被专门化以形成更多 
具体的类别。例如，一般的公司类别能被专门化为制造公司和销售公司。每个 


专门化类别继承了比它抽象 

方法或覆盖了它继承的属性 

的方法，产品数量能从原料 f 


1匕它抽象的类别的属性和方法，而且可能增加了新的属性和 

i 的厲性和方法。比如,制造类别可能需要能决定产品数量 

、原料的单位数量中计算出来> 但销售类别可能就不需要 

这种方法了 • 

(2) 当程序运行时，类别被具体化以形成对象 。名 

化,产生两个对象，~个表示为 XYZ 公司,另一个表示为 ABC 公司，虽然5 

个对象有相同的方法和相同的属性，但他们的属性值(如，他们的资本化、规模、 
产品类型)可能是不同的。 一 个对象的方法可能向另一个对象传送消息，因此 

影响到它的状态。例如, XYZ 对象的一种方法可能向 ABC 传送一个消息要求 

LABC 的- 


r 能被具体 

虽然这两 


它卖出一些7 

囬应。 


3C 的一种方法可能以它希望卖出产品的数量和价格作为 


正如这个简要的总结应该表明的，从对象导衫 
步。人们为每一类型的行动者建立一个类别，提供保存行动者目前状态(记忆） 
的属性，并加人合适的方法来观脚行动者的环塊(感知)和依据某些准则(政策） 
来执行行动者的行动(表 现)。 另外，人们需要编出一个调度程序用以在模拟开 
始时具体化所需要的行动者数目,并给每个行动者一个行动的开始，第3章包 
含了4建立这一模拟的例子。 


我们在前面一节巳经注意到，在大多数模型中行动者都需要具备能力去感 
3他们的环境状态，从其他行动者处接受消息，依据他们目前的状态积极地选 
，行动去表现，并向其他行动者发出消息。实现这些的一种方法是陚予行动者 


以下的内容： 


(1) 一组行为准则 • 这些准則决定行动者将要做什么。依据行动者目前的 
状态，一个或更多的准则将从这组准則中被选择 出来。 这些准则通常被称为 
“条件一行动”准则，因为它们同时包含了条件要索(如果准则要被使用，什么必 










须是真实的)和行动要素(为执行准则将要做什么)。比如，一个此类的准则可 
能是“如果我能在附近找到食物，那么我将向它移动一步”。 

(2) —个工作 记忆. 这将由储存了行动者目前状态的变量组成 • 例如，工 


作记忆可能储存了行动者目前的方位和它目前的能量储备。 

(3) —个准则翻译程序。这是一些程序编码，它们使用工作记忆以便选择 
哪个准则应该被激活或被“解雇”。它可能需要处理由多于一条准则构成的条 
件要素被满足的情况，因此需要一些在准则间进行选择的 方法。 

(4) —个输入过程。这将从环境中收集消息和感知，并将它们存储在工作 
记忆中以通过准则处理它们。 

(5) 一个输出过程。这将传递消息到环塊中，在途中传递到作为预期接收 
者的行动者那里。 

这种安排被称为生产系统，准则为生产准则 (Nilsson, 1998; Waterman &• 

Hayes-Roth, 1978), 在生产系统的要素与以上列明的行动者值得拥有的特征 

之间的对应应该是很清楚的。一个相对简单的生产系统能从诸如 JESSCthe Ja¬ 
va Ejq>ert System Shell, http s //www. jessrules. com/) 这样的工具包中被建立 
起来 (Friedman-Hill， 2003)。作为替代性选择，也有一些更加精致的系统，这些 
系统是基于心理学上可能的人类认知模型，比如 SoaKLaird，Newell &. Rosen- 









对总和应用一些非线性数学转换(如 logistic 或双曲正切），然后再将信号传送 
给下一层级的所有单元。第一层的单元从网络之外接受输人，每个单元接受一 
个，最后一层则发送一个由这一层每个单元发出的信号组成的输出结果。 



在 ANN 最简 | 
E 用于输人时，就辖 


I最简单的应用中，网络被用来识别各种模式,每当一个特定模式被 
.时，就输出一个特定结果。例如，一个 ANN 可能被训练去识别条形 
r -。 在训练之前，所有的连接权 
t 形码作为输人应用到第一层只导致在输出 
5为反向传播算法的方法接着被使用。这种 
方法将实际输出与期望输出相比较(比如，它将未受训练的网络产生的随机数 
字与条形码被期望产生的数字串相比较)，并调整连接权重以使输出结果更靠 
近期望输出结果一点儿。然后，另一个输入(如，另一个条形码)被应用，将实际 


码，并输出与条形码线的每个棋式相对应白 
重都被设定为随机数值。将一个条形码作 
层上一个随机信号模式。一种被称为反向 




Ceccom&. Parisi, 1998) ，那就是创建一大群 ANN (每一个 ANN 对应一个行动 
L 重初始化，并被设置一个诸如从一片 
知被 反馈到 ANN 

的输入中，输出与行动者的行动诸如移动和摄取食物相接。行动者被赋予一个 
初始的能量值，在每个时间段上都会有其中的一些能量被消耗掉。如果能量降 

为0,行动者就会“死亡”，并从模拟中移除出去。然而，行动者可以通过摄取食 


者〉。 这些行动者都被一组随机的连接权重布 
区域中收集“食物”的任务。行动者对它前面夫 


物来增强能量，食物散布在地理区域当中。因为行动者的 ANN 被初始化时所 
用的随机连接权重，大多数行动者在寻找和摄取食物时都将失败并会很快死 


亡，即使有一会成这些更成功的行动者进行再生产，将与他们自己相似 
的连接权重给予他们 1 的后代，但会有轻微的变异。逐渐地，行动者群体将学会 


获取食物的 行为。 虽然一些差异仍将存在，但每个行动者的能力将一代一代地 
提高。 因此，不像反向传播方法那样直接地改变连接权重，这些模型运用了一 
种达尔文选择的形式，以更具适应性的权重来产生行动者。 

与运用生产准则对行动者进行编程相比,神经网络的优点在于它们更具灵 
活性并且能够发展出研究者没有考虑到的行为。神经网络也被认为比生产准 
则系统更接近于人类大脑(伹必须承认虚拟的神经网络与大脑中的生物神经网 
络的运作方式非常不同，同时也更加简单八另一方面，一旦神经网络被训练， 
就几乎不可能去发现它为什么会运作:人们所全部攀握的就只是一个连接权重 
的矩阵，这个矩阵不能用单元的活动提供关于其行为的全面解释。但用生产系 
统，人们可以利用准则去解释行动者的行为》此外，使用通过一个进化过程来 
训练的神经网络模型是非常占用运算资源的。为了进化一个运行着的行动者， 


人们需要一个庞大的初始群体和长时间的发展。 


环境 


前面一节巳经描述了构建行动者的3种方法 a 行动者在一个环境中行动， 
环境提供了行动者之间沟通的渠道，同时也可能包含无反应的对象，比如障碍 
物或能量源。 








成它是一自然”的方式，对应于环境在人类事物中的角色，同时也因为它使 
监督行动者变得更加容易。它也意味着从一个行动者传递到另一个行动者的 
消息能够被暂时地储存在环境之中(缓存的〉，减小了模拟结果依赖于行动者编 
码被执行的命令偶然性的可能性。当进行缓冲时，来自行动者的消息被储存在 
一个临时变量中，直到模拟中的所有行动者都有他们轮到的机会 a 然后，这些 
存储的信息被传递给接收者。 

在许多模型中，环塊会包含被动的对象，比如区域的栅栏，行动者可能经过 
路”和连接，为行动者提供能暈或食物的资源，等等。这些都可以用与行动 
i 类似的方法来编程，甚至可以更简单，因为它们不需要具有任何能力来对它 
们周围的环境作出反应。 


世界中环境的影响通常是非常重要的。人类生活的许多复杂性都来源于要处理 
复杂的环境。我们经常把环境当做一个记忆体 ( 比如，将物体放在特殊位置上以 
提醒我们箱要采取的行动)，当做价值的储存器(比如，货币和其他形式的财富)，以 
及当做一种使某些行为更加简单的技术性帮助（比如:提供通讯和交通服务的设 
备〉。 然而，研究者在设计模拟模型时很少能认识到这种环境复杂性。 

随机性 













Watts &• Strogatz, 1998), 这些替代性方案为网络提供了不 同的; 
些结构特征可能会导致相当不同的行为 (Pujol，Flache, Delgado i 
2005). 


随机性可能也被用于模型化 ？ 

(1997b, Axelrod & Dawkins, 1990) 提出了一个具有影响力的关于文化传播 
(Axelrod, 1997 c ) 的模型以解释如果进行互动的人们的侑仰和态度倾向于变得 
越来越像，为什么差异最终仍然不会全部消失。他的模型展现了具有同质性文 
化特征的稳定区域的出现，这些同质性文化特征有方苜、民族主义倌仰、宗教风 


俗等。在他的模型中，行动者拥有“标签 '一 组包含5个数字，用以描述 
5个文化特征或维度上的文化特点。 [2] 两个行动者进行互动的机会取决 
标签的相似性。如果他们进行互动，5个特征中的1个特征就会被随机选出一 
庚受与其互动的另一个行动者在这个特征上的值 4 经过几千次互动 
啲区域出现了，在此区域中所有的行动者共享相同的特点，并且与其 


个行动者接3 
之后，独特的 


敛如何能够引发全球I 
San Miguel, 2003〉显; 


他区域中的行动者没有共同的特点。 Axelrod 评论说他的模型显示了局部的收 
I发全球的极化。然而，稍后的研究 (Klemm，Eguiluz, Toral 
)3) 显示了这种行为严重依赖于行动者精确地复制其他行动者 
果行动 
生了随 
个区域 
型的结 
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间阶段中。每一个时间段都持续相同的模拟期。楔拟从零时间点开始，持续足 
够长的时间，直到所有的行动者都“死亡”或停止行动为止。 

当使用离散的时间段来设计基于行动者棋型时餺要考虑3个关于时间的 
问题： 

(1) 共时性。在前一节中我们巳经提到蘅要注意消息从一个行动者发送到 
另一个行动者的 时间。 比如，如果行动者 A 发送一个消息给行动者 B, B 回复， 
然后 C 再发送一个消息给 B， 这个结果可能与 A 发送消息给 B， 接着 C 发送一 
个消息给 B， 然后 B 再发送一个消息给 A (例如以“内部者交易”模型为背景来思 
考这些顺序)的结果截然不同。这是关于行动者调用次序这种更普遍性问题的 
例子 (Hube_ & Glance, 1993), 如果使用一台普通的电脑，因为一次只能 
做一件亊情，因此，实际上行动者不能同时参与行动。处理这一情况的3种可能 
方法如下： 














假设我们正在设计一个关于组织决策制定的模拟并且有一个模型，其中的行动 
者是决策制定委员会。棋型的焦点为每个委员会作出的决定以及这些决定如 
何从一个委员会传递到另一个委员会。在委员会会议之间发生了什么是不用 
考虑的，而且会议本身被认为是瞬时发 生的。 在这个模型里，具有一个规则的 
时间步骤是无效的，因为在大多数的时间段里没有有趣的亊情发生。相反，应 
该设计一个程序便于从一个委员会会议时间“跳跃"到下一^会议时间。 

(3) 校准时间。在规则的和事件驱动的模拟模式中，经常有将模拟时间与 
真实时间匹配的问题。例如，如果有一个消费者行为模型，在这个模型中某人 
想要研究消费者对一个新产品介绍的反应。比较有趣的事情在于大部分消费 
者接受这个新产品所要花费的时间》这个模型可能会显示这需要花费多少时 
间段，伹是人们如何能将这转换成真实时间中的星期和月份？ 一个解决办法就 
是在现实中观察这个过程，并将新产品接受趋势的形状与模拟的结果相匹 K， 
但这只是给出了大致的解决办法。另外，在这个和其他例子中,关于将什么当 
做模拟和真实世界中的起始时间或零时间点仍然是一个难题。虽然模拟是在 
—个界定淸晰的时刻开始的，但是在真实世界中,很少有什么活动(例如,一个 



第 3 章 I 在社会科学研究中使用基于行动者 
的模型 


在过去的十几年里，基于行动者的模型巳经发展出或多或少标准化的研究 
程序,包括一系列的步骤，像大多数社会科学研究方法一样，这是实际执行程 
序的理想状态，事实上，许多步骤都是并行发生的，并且整个程序在构想被提炼 
和发展时被重复地执行》尽管如此，将这些步骤弄清楚以作为进行基于行动者 
建模研究的一个指南是有帮助的。 

在研究的早期阶段，将宽泛的研究议題缩小范围到具体的研究问题是有必 
要的。研究问题是一个在研究工作里面有一个能回答它的实际机会的问题。 
如果一个研究问题太模糊或太宽泛，是没有多大作用的，而且研究也会令人失 
望，因为它不能提供期望的答案。如果错误出在明确性方面通常会更好一些： 
是太集中而不是太模糊。有时候将界定研究问題想象成剥洋葱皮也会有些帮 
助，从调査研究的宽泛领域开始，通过特定议题，到一个研究问题，对于这个问 
题仅仅只需对你所发现的做一个简要陈述就能回答。 
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不同的类型。例如，虽然在第1章中回顾的民意动力学模型只涉及一种类型的 
行动者，但那些意见发生改变的行动者也被模拟出来了，第1章中提及的某些工 
业区域模型涉及一些独特类型的公司*对每一类型的行动者而言，籥要将行动 
者的行为放在不同的环境之中,这些环境通常是作为一组条行动准则(参 
见第2章第1节)。在两个列表形式中来完成这一步是有帮助的:一个列表展现 
了环塊(包括其他行动者)影响行动者的所有不同的方式，一个列表展现了行动 
者能够影响环境(再次包含了其他行动者)的所有 方式。 然后，人们可以写下当 
行动者必须对环塊变化作出回应时的条件，以及当行动者需要对环塊作出行动 
时的条件。然后这些列表可以被提炼用以创建行动者准则来显示行动者如何 
对环境刺激作出作用和反作用。 

在这个阶段，人们将会对模型中需要的行动者类型和它们的行为有一个很 
好的构想。我们有必要去考虑环境应该采取的形式是什么(例如，是否需要是 
空间的，在其中行动者有一个确定的位置，或者行动者是否应该被连接进一个 
网络)，以及考虑为了表明模型正在生产所期望的宏观层次的规律性，模型需要 
展现的特征有什么。一旦所有这些都被考虑过，躭可以开始设计和发展形成模 
拟的程序代码。 

在模型已经被建构起来以后，人们就开始了检査它是否正确的漫长过程。 
这种检査非正式地被称为除错，正式地被称为检验。检验的任务是确保模型满 
足它意图实现的具体规划。它与有效性验证相当不同，有效性验证是检査模型 
对于被模拟现象而言是一个好的模型。一个模拟能够满足检验的标准，是因为 
它可以按照被期望的方式运行，但是如果模型的具体规划是对社会世界中原型 
的一个抽劣描述，那它就不是一个有效的 模型。 

在成功的检验之后，躭可以着手进行有效性验证。有效性验证的首要标 
准是检验模型是否展现了研究试图要去解释的宏观层次的规律性。如果它做 
到了，就可以证明编程进入行动者的互动和行为解释了规律性为什么会出现。 
然而，必须提防眷代性的解释，因为可能存在其他同样的或看似更合理的行动 
者行为，它也会导致相同的宏观层次的规律性。因此，需要进行灵敏度分析，来 
检验当模型参数被改变时结果是否也会变化。同样重要的是，要考虑不同的行 





动者行为是否能导致相同的结果，特别是一个更简单的模型是否能得到相同的 
结论(如果得到相同的结果，简单的棋型通常应该比复杂的模型更受靑睐，使用 
的原则是简单的解释比复杂的解释好，如果两者在解释上做得同样好的话)。 

因此，在探讨了模型的宏观行为之后，接下来就应该将模型的结果与来自 
社会世界的经验数据做比较。正如我们将会在下文中看到的，模型结果和数据 
间的这种对比进行起来并不容易，而且经常并不会得到期望中的清晰的 答案。 
大多数的模型都是随机的 ，即都 涉及随机过程，所以人们可能并不淸楚模型输 
出和观察数据之间的差异是因为随机因素所致还是因为一个不好的模型所致。 
在收集有效和可靠的数据时也经常存在较大的困难，特别当需要与模型输出结 
果相比较的数据要通过观察很长时期才能收集到时更是如此。 

最后，人们可以得出一些结论，期望可以回答开启此过程的研究问题。另 
外，如果人们对棋型有信心的话，可以试验这个樓型，从而确认先前不受怀疑的 
规律性。 


发展基于行动者的模型的例子 

在这一节中，我们 引用一 个“集合体” (Gilbert，2006) 模拟作为例子来播述 
发展一个简单的基于行动者的模型的过程。在第4章中,我们将看到这个模型 
是怎样被编程的。 

许多相互关联的社会现象是很难被模型化的，甚至很难被描述出来，因为 
它们的边界是流动的，涉及的人也总是在不断地变化中，而且也不存在被所有 
参与者都共享的单一特征。一些例子如下： 

⑴青年亚文化圈，诸如“庞克族” (Widdicombe & Wooffitt, 1990) 或“哥特 
派，， (Hodkinson, 2002), 

(2) 科学研究领域或专业 (Gilbert, 1997), 

(3) 艺术运动,诸如前拉斐尔派或旋涡画派 (Mulkay & Turner, 1971), 

(4) 社区，诸如伦敦的诺丁山或纽约的布朗克斯 (CTSullivan MacgiU, 











as, 1S39/1969) ，虽然严格说来这个概念应该只能应用于个人，而不能应用于组 
织或其他类型的行动者。在这一节中，由于缺少更专业的术语，我们使用词语 
“集合体”作为通用的术语。需要注意的是，组成集合体的单位可以是人(就像 
上面大多数例子里的那样)，也可以是组织(如生物技术公司乂 


获得对集合体的更好理解的第二个障碍在于，根据定义，在它们周围没有 
明确的边界。这意味着不可能去计箅它们的成员，因此也不可能对它们随时间 
的发展以及它们的发生率等运用更常用的定量分析。 



宏观层次规律性 


所有集合体在或多或少的程度上都拥有以下这些内容： 

(1) 虽然集合体的例子通常在总体层次上比较容易命名和描述，但对其精 
确的界定被证明是相当棘手的，而且存在商议和争论的可能(举例来讲，有许多 
不同的地区也能够被描述为诺丁山，范围涉及当地正式的行政区域到与之同名 
的电影拍摄地点)。 

(2) 没有一个已经被大家接受的共识性界定能够被用来从那些“外部”者中 
区分出“内部”者来(或从非成员中区分出成员来)。例如，虽然从某人的穿着方 
式，人们可能认为他或她是一个“庞克”，通过指出这个人的信仰、行为或熟人， 
其他人(包括这个人本人)可能会对这个归类提出质疑。这些信仰、行为或熟人 









都可能与作出的关于成员身份的决定有选择性关联。特别需要指出的是，不存 
在一个可观察到的特征是所有“内部”者都具有但闻时又是所有“外部”者都不 


具有的，例如，集合体并不是正式的组织，在正式组织中拥有书面或口头合同 
的雇员与组织成员相 区别; 也不是政治党派，在其中最少需要一份正式的支持 
声明并以此来界定成员》也不是社会阶级，在其中外部确认的客观标准被用于 
对人们进行分类(典型的是某人的职业)。 



没有成员会拥有全部的知识，知识是社会性的。 


<5)被认为与集合体相关的特征的 改变。 例如，研究者不会无限期地连续 
研究完全相同的问题》—旦他们解决了一些问题，他们便向新的问顯转移，不过 
仍然会在相同的研究领域。大多数政治运动都会随着时间的推移而改变它们 
的宜言，以反映他们当前的想法和他们看到的发生在其周围的社会问應，尽管 
他们仍旧是相同的运动，拥有许多相同的追 随者。 青年文化总是在不停地变换 
被认为是流行的事物。 

(6) -些参与其中的人被广泛地认为(比如被其他人认为)与其他人相比他 
们是更中心的，更具影晌力的，有更高地位的或是领导者。例如，一些科学家被 
认为比其他科学家更加杰出，一些亚文化圈中的成员比其他的成员更“酷”， 


微观餍次行为 









文化而言，是关于目前流行是什么的知识。因此,并不是每一个成员都有相同 
的知识，对知识的掌握通常是集合体的一个主要特征 ( Bourdieu ，1986). 在模 
型中，我们假设所有个体、成员或非成员，都有相同的知识，伹是这一知识是什 
么在行动者之间是不同的，并且随着时间的推移而变化。我们用这一知识来为 
行动者定位:行动者某个时刻在一个抽象知识空间中的位置是他/她在那个时 
刻拥有知识的函数。 

第二个假设是一些行动者具有比其他行动者更髙的地位，而且所有行动者 
都被激励试图通过模仿高地位的行动者(通过复制他们的知识)来获得地位。 
例如，在一个受时尚驱动的集合体中，所有行动者都想要尽可能的时尚，这意味 
着要接受被他们认为具有最离地位的那些人的服装款式、音乐品位或任何东西 
( Simmel , 1907). 然而,地位也是稀缺的函数 :一个 行动者并不能持续拥有髙的 
地位，可能有许多其他的行动者具有非常相似的知识。例 如:一 个时尚偁像必 
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检艙 

对集合体模型的检验和有效性验证我们会在第4聿中再做讨论，安排在我 
们描述完如何对它进行编程之后。首先，我们需要考虑在检验基于行动者的模 
型时产生的一些普逍性问題。 

检验： 处理漏洞 

你应该假设不管你多么仔细地设计和建构你的模拟，它仍将包含漏洞(做 
了与你想要的和期望的不同事情的编码)。当你第一次运行一个新的模拟模型 
时,它很可能有许多漏洞，其中的大部分漏洞都很容易观察劲，因为模拟会给出 
异常的结果或导致程序崩濟。更令人担心的很有可能是，即使当你已经在编码 
上进行了处理去除了明显的漏洞，但仍有一些漏洞会隐藏着，使你在未察觉时 
一直被困扰。经验法则把剩下的漏洞数量看做是遵循了一个负指数函数—— 
漏洞数量首先快速下降，然后趋于平稳，但从来不会触及0,有时甚至已经发表 
的模拟也会受到漏洞和错误解释的困扰 (Edmonds Hales, 2003, Galan &. 



(Ramanath Gilbert, 2004) • 下面列举 一些： 


<1) 梢细地编码。当你撰写棋拟程序时，仔细稳重地去做，不要匆忙地使编 
码运行并寻求捷径，这样任何节省下来的时间会在去除漏洞时花费的额外时间 
中失去。使用对象导向的语言和在你的模型情境中具有意义的变量名称将会 
起到帮助作用。 

(2) 包含大量的输出和诊断，如果编码不能给出输出结果以显示当程序运 
行时发生了什么的话，是很难在这样的编码段落中发现漏洞的。不要满足于只 
显示模拟的结果,即使在去除漏洞期间，你也需要显示中介值。同时也需要注 
意决定显示什么以便于你得到好的诊断，但也不能有过多的结果以至于你不能 
找到漏洞的症状，因为其他输出结果会将它们埋没。 





包含一个能够设定到去除漏洞水平的全馬变量:从 0 到最大值。在每次去除漏 
洞陈述前都对这个变量进行一次检验，以査看陈述是否应该在目前去除漏洞水 


(6) 增加评论并及时更新》所有编程语言都可以插入评论一这是让编程 
员看的文本，并不会作为程序编码被执行。运用这个特性对每一个功能、程序、 
方法和对象添加评论。评论应该描述接下来的编码块是什么，以及这个编码块 
如何运行，伹是这种描述只是在概念层次上而不是在执行层次上(即不是重复 
程序编码，而是说明编码想要实现什么目 标〉。 一条经验法则是评论的行数大 
约是鏞码行数的三分之一。评语很容易过时，因为它描述程序以前的情况而不 
是现在的情况。应该预留一些时间来定期更新评论。在写评论时，假设读者是 
像你一样能够编程的人员,但对你的模型知之甚少或完全不知(在离开编程几 
个月之后，这可能是对你本人的一个很好播述，所以不要以没有其他人会看你 
的编码为借口逃避写评论八 

(7) 使用单元测试。单元测试是一个越来越流行的用以减少漏洞的软件工 






果与一列期望结果做对照 • 然后这个测试工具将自动地运行每一个输人，检査 
实际产生的期望输出结果。一旦单元通过了测试工具的所 有测试 ，你就可以继 
续写下一个单元。有时候可能要对第一个单元做一些修改，然后这些修改必须 
被再次放人澜试过程以确保修改没有引人任何新的獮洞。当许多单元都巳经 
被写好时，澜试工具会被用来在全部单元上自动执行所有测试，因此可以基本 
确保漏洞没有作为编码发展的结果在不经意间掺杂进来。当程序发展时，应该 
写出-些另外的测试以验证多个单元的集合体以及它们之间的互动。 

<8)用已知情境的参数值测试。如果确切地知道了任何情境的参数值和输 
出结果，就对模型是否复制了期望行为进行测试。这是大多数人首先会用在模 
型上的测试，但是这个测试本身是一个相当弱的测试，不能有充分的倌心保证 
模拟没有漏洞。 

(9) 使用拐角 测试。 用可能的参数极端值来测试模型并确保输出结果是合 
理的(这个名字来源于这种参数值标记了一个含有所有可能参数值的参数空间 
的角落)。例如，可以测试一下当你的模拟在没有任何行动者时运行会发生什 
么，以及当模型在拥有所允许的最大数量行动者时运行会发生什么。 


有效性验证 




提郅的一些电力市场模型，其中 i 


的冊求模式，都是相关的。这些类型的基于行动者6 
行有效性紐 (Boero & Squazzoni, 2005). 


抽象模型的目标是展示许多社会生活领域背后的一些基本社会过程 。一 
个很好的例子是 Epstein 和 Axtell 开拓性的著作《成长的虚拟社会 
Artificial SocietiesHEpst^n &• Axtell, 1996)， 它展现了关于一个虚拟社会中 
经济的一系列连续逐渐复杂的棋型。另一个例子是本章先前介绍的集合体棋 
型。 这些模型没有想要模型化任何特殊的经验案例，而且对于某些模型而言， 
可能很难发现其与观察数据有任何紧密的联系。例如， Sch 

立在一个规则的圆环形网格上,行动者被二分为两彳1型< 

这些特征明显没有想要成为任何真实城市或真实 I i 的经验描述 * 那么这样 

f 才可能是有效的？ 

I型看做是理论发展过程的一苛，并将通常应用于评价理 
1. 也就是说，抽象模塱霈要在宏 i 层次上产生被期望的和 
微观层次上貌似合理的本 
t 体的或“中层，，的理论 (M 
层理论和基于它们之上的模型能够根据经验数据进 
抽象模型是使用演绎策略创建的，就会存在一些关于行动者行为和期望的宏观 
层次模式的假设。因此第一个有效性验证测试就是评估模型是否的确产生了 
期望的宏观层次模式。更加彻底的测试将会看到当模型的参数被系统地改变 
时将会发生什么(参见第3章第4节，关于敏感性分 析〉。 人们可能期望宏观层 
次模式在参数变化时维持不变，或者期望如果它们变化，这些变化也可以被解 

释，例如，在 Schelling 的模型中，可以改变行动者的容忍度，当容忍度取较小 

值时，家庭很少能找到他们感到幸福的地点，并且模拟要花费很长时间才能达 

到稳定状态，如果它曾经达到过的话。当容忍度取足够大的值时，不管家庭的 

邻居顔色如何，他们都会感到满意，并且最初的居住随机分布模式也很难改变。 


g 的模型一般建 

:和绿)。模型的 














—旦这些基本的测试都已经通过了，就能够评估模型是否能够被用来向理 
论报告具体的社会现象，然后就能够测试那些理论了。例如, Schelling 的模型， 
虽然是针对种族隔离问题提出来的，但却比这一问题更具普遍性和抽象性。它 
能被应用于行动者的任何角色。但是当被用于解释种族隔离时，人们就需要开 
始发展这一理论以将其他因素包含进来，这些因素对于决定城市中的处所位置 
无疑是重要的，包括支付能力和房屋储备的可得性，存在两个以上的种族群体， 
存在不属于任何种族或属于不止一个种族的人群，以及种族态度的功能 形式。 
(例如, Bruch 和 Mare 2006年指出， Schelling 模型中的隔离效应取决于行动者 
对幸福或者不幸福有一种明确的态度，如果行动者在从幸福到不幸福的范围内 
有一个平缓连续的态度，就不会导致群体聚集的出现。） 


我们在第1章中提到的那些模拟消费者行为，产业区域，以及创新网络的模 
型等，都被认为是“中层” 棋拟: 它们都意在描述一个特定社会现象的特点，只是 
以一种具有足够一般性的方式使它们的结论能够被广泛地应用于大部分的工 
业区域中而非仅此一个。 

这种棋型的普遍性特征意味着通常不太可能非常精确地将它们的行为与 
任何特定的可观察到的例子做比较。相反，人们期望满足于质上的相似性•这 




中层棋型的一个例子是 Malerl>a，Nelson,Orsenigo 和 Wimer(2001) 关于电 
脑产业的研究。他们描述自己的模3!是“历史一友好的”，其意思是尽管此模型 
不能复制电脑产业的完整历史，但是它能够 



出合理的预测。另一个非常不同的例子是 Dean 等人 (1999) 对美国西南部阿那 
萨吉印第安人的研究 • 大约在公元前1800年，这些印第安人在长屋河谷开始种 
植玉米，但到3000年后就放弃了这块区域， Dean 等人提出模型的目的就是回 
搠河谷中的定居模式并将这一棋式与考古学纪录一户一户地进行匹配 • 


如果能够获得这样精确的匹配，它们就会非常有用，不仅能对作为棋型基 
础的理论有一个强有力的证明，而且也有助于进行看似合理的预测。然而，有 



例如，行动者可能具有从一个随机分布中被賦予的初始特征。如果行动者发生 
互动，他们的互动模式就可能是随机选择的，等等。相同的情况在现实社会中 
也被假设为是真实存在 的:发 生什么事情有一定程度的随机性。这种随机效应 
就是当运行棋型许多次时，每一次都将产生不同的结果(在下一节中会对此做 















合度 • 


比较理论和横型 :灵敏 度分析 

对理论与其棋型之间拟合度的最好评估是运用理论推演出一些关于变量 
间期望关系形式的命題，然后检验当模型用各种不同的参数设置运行时，这些 
期望分布实际上是否真的会 出现。 每一个参数设置都对应于棋型作出的一个 
假设。人们或者通过测置源自于经验数据的值，或者通过敏感度分析来检验每 
— «置。虽然前者更可取，但是有许多参数不能被实证检验，对于这些参数 
而苜，进行某些形式的敏感度分析是必要的。 

敏感度分析的目的在于理解模型产生期望结果的条件。例如，在第1章中 
推述的民意动力学棋型中，人们可能会问，极端分子必须要多极端才能使所有 
行动者最终都加人到一个极端的派别中去？为了找到答案，需要对一系列不确 
定的参数值进行模拟，参数值的范围可能是从 0. 5到 1. 0并以 0. 1为间描(如， 
运行6次棋拟)。但是，棋型包含随机因素(例如，行动者“相遇”和交换意见的顺 
序是随机的），所以人们应该不会只满足于运行6次，而是会对每个不确定的参 
数值都运行许多次以获樽一个平均值和方差。如果对每个参数设置重复运行 





但更糟的是，大多数模型都包含许多参数，而且它们之间的互动可能会影 
响模拟(如，出现极端分子群体的数量取决于极端分子的不确定性和极端分子 
在政治谱系中的分布，参数所具有的影响既是独立的也是组合的），因此，在理 
想状态下人们需要检验全部参数的 F 有值在所有组合下的输出结果。即使只 
有一些参数，也需要天文数字般的运行次数，因此这不是一个切合实际的 策略。 

如果我们将每个参数的范围想象成分布在一条轴线上，所有参数的集合就 
界定了一个多维的参数空间，在此空间中每一个点对应一个参数值的组合，在 
进行一个完整的敏感度分析时，任务的参数值范围能够被量化为这个空间的体 
积，而且任何削减空间的方法都将减少需要的模拟运行数量。一个明显的方法 
是使用以前的经验知识去尽可能多地限制参数范围。例如，我们可能知道一个 
参数虽然理论上能够取0鰂100之间的任何值，但实际上它从没有被观察到有 
大于10的值，另外，我们可以通过限定我们测试的参数值范围来限制模型的适 
用性:我们可以说只有参数在5到10之间的某处时模型才是适用的，我们不去 
考察当参数超出这个值域时会发生什么。 

另一种方法是对参数空间进行抽样，它能够与限定参数范围联合起来使 

用。这种方法并不会在空间中每一个点上执行棋拟运行，而是只使用某些点。 

这些点可以通过随机选择，或者是有意识地选择去检视我们特别感兴趣的组 










社会科学家习惯对从 
比较:这种比较是在一般 
(Fielding & Gilbert, 2000) 
算因变量的预测值。同样，> 
与经验观測值之间的拟合度 


2000 ). 

同样，人们能够测暈从 
1的拟合度(实际上就是两 


I用于模拟模型。 
t •重要特征在于输 


祺拟模型的一个重要4 
如，在一个关于消费者行为的模型中， 
中可能被观察到从0发展到大多数人。 
销售增长相比较。因为用于比较的数据 
关的事实:在时间*+1时的值并不独立 
统计程序能用来比较这种时间序列数据 


小结 


在本聿中，我们考虑了一些涉 
问埋。通过例子我们给出了在开 i 
在使模型具有可检验性和有效性 E 







第 4 章！设计和发展基于行动者的模型 


工具箱，程序库，语言，框架和环境建模 


虽然某些建模者只使用一种常见的编程语言(任何语言都能使用，但最频 


繁使用的是 Java) 来建立他们的基于行动者模型，但这是一种较难的开始方式》 
多年以来，许多模型都具有相同或相似的构建模块，相互之间差异也很小。为 
了不继续无谓地重复相同的工作，经常被使用的元素已经被集成到可以连接进 
基于行动者程序的程序库或框架中。其中第一个被广泛使用的是 Swarm(ht- 
tp,//www. swamu org/), 虽然现在这个程序库基本上己经被完全取代了，但它 


的设计影响了更现代的程序库，诸如 Repa»t(http«//repa8t. aourceforge. net) 和 
Maso^http,//^ gum. e«W~ eclab/projects/masoix), 后两个程序库都是用 
Java 与成的，所以最容易连接进同样也是用 Java 写成的棋型中，但它们也能以 
其他语言来使用。 Repast 可以获得应用于. NET 的版本并且能够很容易地连 
接进用 C# , Visual Basic 和 Python 写成的程序中。两者都具有一系列相似的 





型化 ； 

(8) —系列去除灌洞的算法，用于进化计算(第5章第2节），随机数的产生 
和神经网络的执行。 

许多人多年的努力都用在了这些程序库的构建上，对它们的使用极大地减 
少了构建模型的时间和产生错误的机会。 Repast 和 Mason 都是资源开放软件， 
非商业性使用可以免费 获取。 它们仅有的不是在于 :第一 ，复杂性，这意味着在 
人们能够充分利用它们具有的广泛特征之前需要花费几个月的时间;第二，建 
棋者被期望使用一个相对低层次的语言，例如 Jwa， 去发展他/她的 棋型。 

更适合初学者的是建模环境，它提供了模型被创建和执行的完备系统，并 
且运行结果不用离开此系统就被可视化。这种环境往往更易于学习，人们在拥 
有一个运作的模型之前所花费的时间比人们使用程序库方法花费的时间缩短 
了很多。然而，简单化的代价就是灵活性更小、执行速度更慢。如果你需要它 


最初是为了其他目的建立的环境也能够被用于模拟，而且有时是非常有效 
的，例如，简单的模拟能够运用电子制表软件包 Microsoft Excel 创造出来，并 
且，免费的开放资潭统计软件包 R(http,//www. ^project, org/) 对于处理大批 
量数据也是很有 用的。 一些重要的基于行动者的模型已经通过使用数学软件 
包 MatLabdorngate, 2000) 和 Mathematica( Gaylord &• D'Andria, 1998) 创 
建出来。尽管如此，为基于行动者的模型而特别设计的环境通常是首选。 


RepastCNorth, Collier & Vos, 2006)® —个有两个程序库的族，一个适 
用于 Java， 一个适用于 Microsoft 的. NET， 以及一^更可视的工具，这个工具允 
许使用脚本语言 Python 来发展槙拟。这两个程序库在功能上是等同的，选择 
使用哪一个只取决于你对编程语言的选择。 Python 系统更接近于棋拟环塊，并 
且不需要先进的编程技巧。 


Repast 具有一个活跃的用户群——来自于学术界、政府和商业公司——和 




目前，最受欢迎的基于行动者的棋拟环境是 NetLogo(Wilensky, 1999). 

,含一个用户界面建设器以及其他的工具，例如系统动态建模器。出于教学 

: 究目的可以免费获取，可以从 http"/ccL northwestern, edu/netlogo/ 下栽 
i 在所有常用的操作系统中运行: Windows，Mac OS X和 Linux, NetLogo 
•一个活跃的用户社区，能够迅速和全面地回答使用者的问题，并且用户適 
然科学和社会科学的所有教育层次《其他环境包括 StarLogo(http：//edu- 
>n. mit. edu/starlogo/) 和 Agoit3ieets(http : . 
t 更适合创建和餍示用于教学的简单棋型而不 


表 4. 1在一些标准上使用了公认的主观判断，比较了 Swarm, Repast, Ma- 
咖和 NetLogo 环境。 不存在对于所有使用者而言都是理想的环境.为了在它 
们之间进行选择，人们需要考虑自己本身的专业知识和编程经验、模型可能具 
有的复杂性，以及研究项目的目标(如，项目是不是探索性的，模型是不是非常 
简单，或者项目是不是为了建立一个相对复杂的棋型并尽可能地与数据进行对 
比以测试它的行为)。 Repast, Mason 和 NetLogo 仍在继续发展并在相当迅速 
地进化，所以表 4. 1中的信息需要与每个系统目前的状况进行对照核实。其他 


的比较和回顾可以在 Castle 和 Crooks ( 2006), Gilbert 和 Banks ( 2002), Rails- 










5 和 Hofmann(2004> 的著作中找到 《 



NetLogo 作为最快能学会和最容易使用的程序库脱颖而出，但是它对于那 
些大而复杂的模型可能并不是最适用的。 Mason 与 Repast 有可比性，但通常比 
Repast 更快，它具有最新程序库的优势，吸收了早期系统的经验，伹是只拥有一 


使用 NetLogo 建立模型 

在接下来的部分，我们将运用基于行动者的模拟环境 N e tLog 0 (Wil ens ky， 
1999〉。 NetLogo, 如同上面提到的其他环塊和程序库一样，在经历着持续的发 
展，每年都会出现一个主打的新版本。因此，在本册中列印出的编码(是使用版 
本 3. 1发展出来的)在将来的版本中运行可能就需要修改。然而， Wilensky 和他 














色但能很容易地被重新着色，因此，举例而言,人们可以创建一个等高线图。视 


图中光点的数量也能够被设 置:当 NetLogo 启动时，视图由 35X35 的光点组 
成，但这个数目可以增至好几千》 

一^ NetLogo 程序有3个部分。第一，一部分说明行动者将是怎样的以及对 
所有行动者而言都可获得的变量名称(全局变量)。第二，具有一个安装程序来初 
始化模拟。第三，具有一个进行程序，它被系统重复执行以运行模拟。图 4. 2展 
现了一个非常简单的例子以给出一个关于 NetLogo 程序的初步印象,其中有10 
个行动者被创建出来并且无限期地随机做来回 运动。 

在这个程序中，没有全局变量，所以从安装程序开始。任何从先前一个运 
行中退出的乌龟(行动者)都会被淸除出程序,10个新的乌龟会被创造出来(这 
些乌龟会被放置在 NetUgo 视图的中央)。进行程序告诉每一个乌龟去执行方 
括号中的命令:首先，向右〈如順时针方向)转一个随机的度数，然后先前进一个 
单元，其中单元为一个光点边的长度。每个乌龟相对于其他乌龟都是在独立地 
移动，所有的移动都是同时的(因为 NetLogo 是在一个普通的电脑中运行，行动 
者不能都正好在相同的时间里运作，但是 NetLogo 通过使用非同步随机更新使 
行动者看上去好像都在同时移动，参见第2章第3 节〉。 



后点击程序标签并输入图 4. 2中显示的几行编码 • 返回到界面标签 4 点击位于 
上方的“按钮”图标，然后点击视图旁边的白色区域。 NetLogo 将 给出一 个你应 
该标注为“安装”的按钮。接着完成相同的操作后会看到“进行”按钮，同时设定 





地在如 NetLogo 的环塊中构建基于行动者模拟的构想。“按钮”(以及滑动条， 
开关等)图形可以通过“拖和放”来控制一个模拟。“视图”不需要进行任何编程 
就为行动者和它们环境的可视化提供了许多可能性。 NetLogo 在界面标签上 
也能显示输出结果变量的动态变化图* M 然 NetLogo 编程语言与通常的程序 
语言有某些不同，但它既强大也简洁，使复杂的模拟能够用令人惊讶的寥寥几 
行编码就能编程出来。 


•了很好的嵌人式教程(可以在“帮助”菜单下找到它)，而且还伴有大董的 
I模型范例，其中有一些范例还与社会科学有关。 







建立模型的第一步是作出一些关于行动者和环境的基本决定。模型设定 
表明将只存在一种类型的行动者，并且行动者将在一个空间中移动》我们需要 
决定这个空间的维度》简化起见，我们将使用能够直接在 NetLogo 视图上绘制 
出来的一个二维网格。为了避免在网格边缘可能产生的特殊效果，我们将使用 
—个没有边缘的圆 环面。 这是 NetLogo 的系统畎认安排,所以不需要任何额外 
的貌 

下一步，最好用图形或者用“伪编码”来列出模型的逻辑 。为 了用图形来显 
示逻辑，使用统一的建模语言 （UMU 会比较方便，它是一种展现程序的方法， 
这种方法是作为一种独立于编程语言细节的沟通软件方法被提出来的 (Miles， 
2006). UML 提供了一系列标准化的图形，能够用来显示程序中对象的种类层 
次。这些图形包括:顺序图显示了一件事情如何引起下一件亊情，与流程图相 
似的活动图。 UML 非常适合于在一篇发表的论文中描述模型，但是集合体模 
型太简单以至于完全不霱要用到 UML。 例如，只有一个种类(对行动者而言） 




和只有两种行动者行为(前进和转弯)。 

对于这种简单的模型，另一种可供选择的方法或许更有帮助一使用“伪 
编码”，这是一种自然语言和编程惯例非正式的混合体，它在不要求阅读者熟悉 
任何特定的编程语言的条件下能够使得程序的结构和流程是清晰的。图 4. 4显 
示了用伪编码写成的集合体程序。 





田 4. 4用伪编码写成的集合体程序 

这个程序有两 部分: 初始化(在 NetLogo 中称为“安装”)和执行(在 Net- 
Logo 中称为“进行”〉。伪编码的首行缩进有助于辨别哪行跟在哪行后面。例 
如，程序循环重复执行 “Loop forever* 和 “End loop” 之间的几行。模型中不变的 
参数用斜体字显示。 












• 4.7 集合体界面 


程序注释 

这一节，在图 4. 5中的每一行程序都会被解释。 
breed[agents agent] 

这一行以复数形式和单数形式命名了将要在模型中使用的类别的名称。 
Agents-oim[around visible] 

行动者类别有两个属性:遍及各处的和可见的。每个行动者在这两个变量 
上都有它自己的值，这两个变量分别储存了行动者周围其他行动者的数董和能 
够看到的行动者 集合。 

当使用者按下界面上的“安装”按钮时，安装程序就被 执行。 这个程序首先 
刪除上次运行时剩下的所有行动者，然后为网格上的所有光点都着上白色•编 
码 ask patches […]告诉所有光点(光点是在网格上的单元格)去执行方括号中 
的编码。命令项 pcolor 是一个 NetLogo 变量，用于设定光点颜色。 










然后 500 个行动者被创建。在方括号里的命令被每个新的行动者独立地执 
行。视图上每个行动者的图像都被着成绿色，并且其大小被设定成最小值的 
两倍. 



然后每个行动者都移到网格上的随机点上 (randon^pxcor 产生一个对应于 

网格左右边缘之间一个随机位置的数宇， randotn-pycoi •在上和下边缘之间的位 

置上完成同样的工作)， heading (行动者面对的 方向〉 用于设定面向一个随机的 

方向。 

while[any? Otber-agents-here][fd 1 ] 

行动者随机分布的结果可能是两个或更多的行动者最后会在相同的光点 
上，一^行动者处于另一个行动者上面，所以这一行命令是让每个行动者去检 
査是否有任何其他的行动者也在同样的光点上 • 如果有的话，这个行动者就朝 
它现在面对的方向前进一个单位 (fd 1) ，然后再次检査，继续前进直到它找到一 
个未被占据的光点。 


到此就完成了每个行动者在被创建之后就立即执行的命令，也将此 setup 
程序带到了终点。 




当界面上的 “Go% 钮被按下时, go 进行程序就被重复执行。每次完成一 
遍此程序，模拟就前进一个时间段。在每个时间段中，所有行动者都被要求去 














around 变 量中， 在生产系统的术语中(参见第 2 章第1节)， around 是工作记忆 
的一部分。 

下一行纗码与前面行非常相似*它会找出能够被行动者看到的其他行 
动者有哪些，即哪些行动者在可见一半径之内，这是一个其值被界面上的另 

一个滚动条所设定的参数。第二行编码与第一行编码稍微有些不同，因为 

变量 visible 储存的不是可见的行动者的数貴而是行动者自身的 名字。 这一 
步是必须的，以便于它们稍后能被辨认出来（在 fcc^towardsW faceaway 程 
序中）。 

“移动”程序既决定行动者将要移动的方向，同时也执行这个行动，用生产 
系统的术语讲，移动程序是一个非常简单的规则解释器》 


if any? Visihle[ 

这个程序以通过检査对于执行这种方法的行动者而言是否存在任何可见 
的行动者为开始。如果存在，行动者需要决定它是“孤单的”还是“拥挤的”，即 
它需要决定条 fr- 行动准则是否都 适用。 





“条件”包括检査在这个行动者周围的行动者数量是否大于用户界面上滚 
动条设定的门植参数的值。如果大于的话，它就是“拥挤的”，行动者就必须远 
离群体的中心。程序 factaway 完成这个任务。另外，为了在视图上显示这些 
行动者，它们的顔色被转变为红色 • 


set color green] 


另一种情况是㈣者是“孤单的”,它们必须移向群体并且变成 绿色. 








—旦行动者巳经设定好它的方向，它就能以一个被“速度”参数所决定的速 
率进行移动(随机速度会返回一个小于“速度”值的随机数字)。和前面一样，如 
果行动者坐落在一个已经被另一个行动者占据的光点上，它就继续沿着相同的 
方向向前移动直到找到一个空置的光点。 



fac^toward 命令检索行动者能够看到的行动者集合(已经被记忆在 visible 
变量里的行动者)，并找出那个集合中围绕在每个行动者旁边的行动者有 多少。 



W face^way 命令与 fece^ward 命令几乎是相同的，但移动方向与最中心 
行动者的方向却是180度相反。 



备 动聚类的中心并可能使其他行动者或者拥挤或者孤单， 


然后其他行动者也将移动。因此，行动者的聚类虽然会持续在一起较长时期 
(用时间段測量的话)，但它会漂移穿过视图。孤单的行动者会移向聚_，有时 
候会加人它，有时候会继续尾随其后。而聚类从来不合并。 

图 4. 8展示了一个典型的模拟快照》在这个图中，拥挤的行动者是深灰色 











出现了。虽然其他微观层次的行为能够产生相同或相似的宏观层次模式 (Gil¬ 
bert, 2002)，但了解产生我们观察到的宏观层次行为的这些微观行动是有用 
的。特别需要指出的是，如果模型满足下列条件,那么我们就能得出结论说，我 
们播述为“集合体”的现象将从行动者的行为中产生 出来： 

(1) 行动者改变它们在知识空间中的观念以应对“过度拥挤” (Mulkay 
Turner, 1971) } 

<2)某些观念和行动者被认为是地位高的或重要的； 

(3) 行动者被激励去模仿和接受这些观念或者它们的变化。 

对模型输出结果和经验数据更详细的比较对于这种抽象模型而言是不适 
用的(参见第3章第3节)。抽象棋型的价值有两层 :根据 Epstein 的名言“为了 
解释宏观的社会模式，我们在行动者模型中产生——或‘发展~~■它们” (Ep~ 
stein, 2007:50;也可参见 Epstein, 1999), 它们能解释特殊现象的产生;而且它 
们有助于凸显现象之间的共同性和差异性，否则这些现象可能被认为是不可比 
较的。因此，这种模型成功的更好标准是它在多大程度上产生了深层的理论问 
埋或者提供了能够从经验上确认有效性的中层理论。例如，楔型提出了这一问 
題《假定“庞克族”和“科学家”的社会形成能够通过相同的普通模型被复制出 
来，那么它们之间显著的相似性和差异性是什么？在许多社会生活领域都可以 








你要对在建立模型时 


真实世界中起作 
队中工作的大型 


独的研究者，你会知道你 


因为基于行动者的模拟 
到，你可能需要雇用一些 
熟悉在 Java 中编 

程序库——参见第 


在有待建模的领域 







(2006) 的著作中可以找到一些有帮助性的论述。 


—篇基于行动者建模报告或; 
(1) 摘要，这应该指出(大致I 
a. 论文中思考的主要研究问 


卜或期刊文章的主要部分通常 如下： 


(3) 戈 
的研究是羊 


价值的补充或改进。关于研究问題或领域的文献，还有关于相关模 
型的文献，甚至那些先前还没有应用到这个领域的模型都应该回頋。这一部分 
应该明确指出报吿的研究中哪方面是一个进步以及它如何借鉴了以前的研究。 
(4) 对你想要解释的规律的陈述(这通常是对导言和综述内容的一个总 


结)。它们可以作为一组你想要证实(或 证伪〉 的正式的假设被提出来，或者也 




可以通过不那么正式的形式呈现出来。 

<5)对模型的描述。这个描述需要足够详尽，在原则上，它应该能使读者可 
以重新执行你的模型并得到相同的结果，但它不用包含程序编码(某些读者不 
会知道和理解你使用的编程语 言)。 作为替代,可以使用图表(如 UML) 或伪编 


















第 5 章 I 基于行动者建模的发展 





是规则的单元格网格，每个单元跨储存一个值 • 光栅变量适用于在平面上连续 
变化的数据，比如日照的髙度和时间。向量变量适用于以点，线或面为形式的 
数据(在 GIS 里被称为多边形)。空间数据可以用投影图来呈现，投影图是显示 
一个三维体表面的方法，诸如在一幅二维地图上的地球。存在众多不同种类的 
投射法可供选择，虽然对于应该使用哪种投射法这样的问题可能更困扰那些想 
要绘制整个地球的地理学家而不是只想绘制一个镇或地区的建模者，伹是这些 
镇或地区巳经足够小以至于在可选择的投射法之间的差异巳经变得无关紧 
要了. 

使用 GIS 建立一个行动者在较真实的地域上穿行(例如只沿着城市街道移 
动)的基于行动者的模型是有可能的6这对于诸如为交通流量 (Raney, Cetin, 
Vollmy Nagel, 2002) 和流行病传播 （Dibble & Feldman, 2004； Dunham, 
2005> 建模的项目而言是重要的，虽然这可能会分散注意力，因为人们的目的可 
能是为一个并不在任何特定地点的抽象过程建模。需要较早作出决定的是在 
整个模拟运行过程中是否将 GIS 地形的不变作为充分条件，或者说，地形是否 
需要剧烈变动。比如，静态地呈现一个城市对交通模型而言可能就足够了，因 


W 


动者建模将会是一项挑战。 

在设汁有空间意识的行动者时，需要考虑的第二个问題是这些行动者如何探 
测他们所穿越地形的特征的。例如，如果要保证行人沿着街道行走，并且不会穿 
过建筑物，对行动者而言就需要有一种方法用以决定前面的路是一条人行道 # 最 
好的解决办法是向 GIS 发送一个査询以决定行动者前方物体的位置，然后分解回 
复的答案以检验向前运动不会受到阻碍。原则上，这并不复杂，但在实践中，它可 
能被后台运行的 GIS 和行动者占用大量的进程空间并滅慢模型运行的速度。这 
些都是当前这代模型构建者们所面临的问題，但在接下来的几年里，它们将会被 
解决，并且有空间意识的基于行动者的建模架构将变得更加普及并更容易使用《 







习 (RL) 和进化计算。两者都是从人工智能中借用过来的，在人工智能中学习方 
法的发展是机器学习，这标志着下一个重要的主通。 


强化学习 

强化学习 (RL) 类似于当我们通过反复试错的方式探索一个新城市以发现 
旅游胜地时所做的事情:你尝试一条街道，如果它看起来前景不错你就继续，如 
果没有希望，你循原路返回再尝试另一条。进行强化学习的行动者具有一种状 
态(如他们目前的位置)和一组可能的行动集合(如向北、东、南和西移动一个单 
元格：环境被创建起来，它最终也将作出回报(到达名胜时的喜 悦)。 行动者 
必须找到一个能最大化他所获取的回报的策略 (Sutton & Barto, 1998). 通常， 
在通往目标的道路上每多出一步都会减少最终的回报，所以目标并不仅仅是发 
现回报，而是要用最有效率的方式去实现它。行动者能够尝试很多次去找到最 
好的策略，探索不同的路径，所以，设计强化学习算法中的一个问题就是在探索 

(尝试新的路径，但可能是不太有效率的和浪费时间的)和开发(保持旧的途径， 

但可能并不是最好的 方法〉 之间的平衡。强化学习巳经被用于模型化公司学习 
其顾客的偏好 (Sallans，Pfister, Karatzoglou & Dorffoner, 2003) 和组织的决 
策制定 (Sun &■ Naveh, 2004), 以及其他现象上。一些作者巳经用强化学习的 
简单棋型去解释和预测在人类主体的实验性博弈理论情境下的行为 (Chen & 







500 墨 


Tang, 1998; Erev &• Roth, 1998; Flache &- Macy, 2002; Macy &- Flache, 
2002 ； Mookheijee &- Sopher, 1994, 1997). 

强化学习很适用于环境和报酬结构在模拟运行期间保持不变的问題。另 
一方面，如果环境是动态的，强化学习就会表现 不佳。 特别需要指出的是，如果 



进化计算 

与学习非常不同的方法是进化计算，这组技术中最简单和最为人所知的是 
遗传算法(其他的有进化编程、进化策略、遗传编程和学习分类器系统)。进化 
算法 (Eiben & Smith, 2003; Engelbrecht, 2002) 基于自然选择并涉及两个基本 
过程: 选择和繁殖。进化计算的基础是一个群体，它的成员通过繁殖形成个体 
的连续世代，这些个体继承了它们父母的特征》成功繁殖的概率是由个体的适 
应性决定的:适应的个体比不适应的个体更有可能进行繁殖并将它们的特征传 
递给它们的子代。 

进人遗传算法 (Holland, 1975) 的个体有可能，但并不需要，成为模拟中的 
行动者。例如，在一个关于产业部门的棋型中，行动者是公司，这个产业部门作 
为一个整体，通过公司的倒闭和成立的世代更替学习如何在产业区域中变得有 
生产力 (Marengo, 1992). 另一方面，每个行动者都可能学习使用作用于行动 
者准则的遗传算法，一旦考虑遗传算法，每个准则就都成为一个“个体” 〈这 就是 
学习分类器系统运作的方法 )(Bull, 2004)。股票市场交易的模拟就是用这些 
行动者建立起来的 (Johnson， 2002； LeBaron, Arthur & Palmer, 1999). 


对于遗传算法而言，每个个体都必须有它自己编码于染色体中的特征。编 












非常不适应的个体则不可能进行繁殖。繁殖通过运用一个被称为“交叉”的过 
程将父母的染色体进行结合来完成。染色体切片从每条染色体中提取出来并 
结合成一个新的染色体，它的一部分来自于父亲或母亲一方的染色体.，还有一 
部分来自于其他行动者。另外，为了确保即使在进行了许多混杂繁殖之后，群 
体中仍然能够继续存在某些差异，子代的染色体中的一些片断会被随机改变或 
变异。 

子代的适应性会被评估以决定他繁殖孙代的可能性。最终，那些相对而言 
不适应的个体逐渐灭绝，并被那些由于继承了父母的适应性而更可能使他们自 
身具有适应性的个体所取代。虽然并没有个体迸行任何学习来作为遗传算法 
的结果，但是群体作为一个整体却被认为在进行学习或最优化，因为其中的个 
体变得更 酿了， 

遗传算法是一个非常有效的最优化工具，但它是否是社会现象的好模型则 
有更大的争议性 (Chattoe， 1998)。一个难点在于通常很难知道测貴“适应性” 
的合适方法是什么，甚或很难知道当把这个概念应用于社会现象时它是否有任 
何清晰的意义9有时候，这并不重要。比如，在一个简单社会的模型中，人们并 
不霱要对适应性有一个仔细推敲的定义:如果行动者有机会并且在这之前没有 
因为缺乏资源而死去，它们就能被设计出来进行 繁殖。 基本遗传算法的另一个 
普进问題在于，将一个行动者所有显著的特征都编码成染色体的二进制字符串 
是困难的。然而，其他进化箅法技术允许更多种类的结构.例如，遗传编程 
(Banzhaf, 1998; Koza, 1992, 1994〉用程序编码来替代二进制字符串;学习分 
类器系统 (Bill， 2004, Meyer & Hufachlag, 2006>使用条件一行动准则作为染 
色体的等价物。 

模拟语言 

多行动者模型一个最显著的特征是，行动者有互动的潜力。正是这一点将 
多行动者模型与微观模拟或基于公式模型(参见第1章第4节)区分开来.互动 
可能表现为对其他行动者存在的一个简单感知，去避开他们或模仿他们，或者， 

















以前遇到的或目前在场的其他物体 




概念发明一个词一^任何宇符串都行，只要不同于他所知道的任何其他词。 
Adam “表达出”这个词并与 Betty 交流。然而， Betty 在这个阶段还不明白这个 
词的 意义。 

为了学习一个共同的词汇， Adam 和 Betty 参与了一个语言游戏 (Steels， 
2004)。这涉及重复进行的对话，其中有一个分值 W 量 Betty 所有概念之间的相 
关性，而且，我们正在讨论的词汇依据她是否断定自己已经成功地理解了话语 
而被更新。这个断定能够基于某些非言语的强化(如， Adam 指向物体, Betty 基 
于对单词的理解或者 Adam 对 Betty 成功完成一个行动的奖励)或是在其他情 
景中对此单词的相似使用，虽然后者需要做更多的推论并更容易出错，当 Bet¬ 
ty 选择了一个概念与此单词相联系 (或更准确地说，是将她知道的每个概念与 
被这个单词表达的可能性相联系），她就扮濟了讲话者的角色。如果她想要表 










享词库用来描述他们都能看到的场景。但这仅仅只是一个开始，为了进行有效 
的交流，行动者需要一种共享的语法以及句法。他们不仅能够把使用语窗作为 
传递说明的一种方法，同时也能把使用语言作为执行诸如命令、询问、说服等行 
动的一神方式。我们仅仅只是探索如何构建行动者能够在其中发展出此类能 
力的系统 (Cangelosi & Parisi, 2002), 但在今后10多年里如果在这方面没有巨 
大进步的话，将会让人非常惊讶。 



资源丨 


团体与协会 

有3个区域性协会推进社会棋拟和基于行动者建棋的发展，每个协会都举 
办年会，每隔一年，他们共同组织一次世界大会， 

• 北美计算机社会和组织科学协会 (North American Association for 
Computational Social and Organization Science [NAACSOS]). 网址： 
http: "ww. casos.cs. emu. edu/naacsos/ 

• 社会系统科学中基于行动者方法的环太平洋亚洲协会 (Pacific Asian 
Association for Agent-Based Approach in Social Systems Sciences [PAAA]), 
网址: http i //www. paaa. econ. kyoto-u. ac. jp/ 

• 欧洲社会模狼协会 （European Social Emulation Association 
[KSA]> 。网 it rhttps//essa. eu. org/ 


你可以缴纳适量的年费,加人这些协会，他们对进人基于行动者建模研究 
社区提供了非常有用的帮助。 


使用基于行动者建模的研究既出现在特定的学科期刊中，也出现在关注社 
会模拟的跨学科期刊中《 2个最著名的跨学科期 刊为： 










simsoc. html 这个网站加人这个名单或査看名单文件。 

有一个由 Leigh Tesfateion 维护的被 称为“ 基于行动者的计算机经济学”的 
精彩网站。上面有许多精心分类的、能够连接到一系列范围广泛的文献的链 
接。网址: http»//www. earn, iastate.edu/tesfatsi/acfchtm* 

本书的网址为 http,//cress. soa surrey, ac. uk/qas^s/. 在这里你能找到集 
合体模型的编码和连接到基于行动者建模资源的链接。 
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